Что такое сортировка фильтрация данных в информатике
Перейти к содержимому

Что такое сортировка фильтрация данных в информатике

  • автор:

Фильтрация данных: операции, назначение, примеры

Содержащаяся в электронных таблицах и БД информация не всегда необходима пользователю в каждый момент его работы в полном объеме. Поэтому в приложениях MS Office предусмотрены инструменты, позволяющие представить информацию в подходящем для обработки виде. В статье ознакомимся с некоторыми из них.

Что это такое и для чего

Один из таких инструментов – фильтрация данных. Ее используют для того, чтобы из всего массива отобрать только те записи, что соответствуют необходимым условиям. При этом вся информация объекта сохраняется, но человек видит только необходимые ему строки, остальные же, не удовлетворяющие заданным условиям, скрываются.

Фильтр в Excel

Отбор производится по одному или нескольким условиям при установке ограничений на несколько полей. Каждое последующее ограничение добавляется к уже существующим, и количество отображаемой информации уменьшается, еще более облегчая работу с массивом.

Во всех современных электронных таблицах и базах предусмотрена возможность нахождения записей. Так как приложения пакета MS Office являются наиболее распространенными в офисной работе, нам следует более подробно ознакомиться с работой фильтров в этих программах.

Excel

В Excel фильтрация данных доступна несколькими способами. Она осуществляется по содержимому столбцов таблиц в зависимости от типа. При этом отбираются конкретные значения ячеек или по условиям. Условия выбора строк тоже зависят от того, информация какого типа содержатся в столбце.

Простейший способ селекции – инструмент панели «Редактирование» вкладки «ГЛАВНАЯ». Выделяем ячейку столбца, в выпадающем списке кнопки «Сортировка и фильтр» выбираем пункт меню «Фильтр». При этом в первой ячейке столбца появится кнопка со стрелочкой, при нажатии на которую открывается выпадающее меню инструментов для сортировки и фильтрации данных в Excel.

Здесь определяются параметры выбора строк для отображения.

Выбор по значениям

Простой фильтр

Для примера воспользуемся таблицей Excel – прайс-листом магазина косметики. Самый простой вид селекции – по значению. В листе цен есть поле «Тип косметики». Мы хотим посмотреть все имеющиеся средства по уходу за ногтями. В выпадающем списке поля – перечень возможных параметров, среди которых есть элемент «Для ногтей». Если список элементов столбца слишком длинный, воспользуйтесь полем для поиска. Снимаем флажки со всех остальных пунктов, кроме искомого, и нажимаем «ОК». Видимыми остались только косметические средства для ногтей.

Можно еще более сократить список продукции, отобрав, к примеру, только изделия производителя «MAX FACTOR» и получив в результате лист средств для ногтей этого производителя.

Результат простого фильтра

Выбор по условию

Как теперь отобразить все средства для волос, если среди типов продукции есть несколько таких видов: бальзамы, маски, гели и т.п.? Можно выделить несколько позиций флажками, а можно задать фильтрацию данных по условию по типу поля.

В нашем случае столбец содержит текст, и к нему применяются текстовые параметры. Пользователь задает строку для поиска в наименованиях. При этом содержимое ячейки приравнивается к строке поиска или исключается из него. Есть возможность нахождения записей, текст в которых начинается с указанных символов или заканчивается ими, содержит их или не содержит. Для задания более сложных условий предлагается настроить свои правила.

Здесь задается несколько условий. Все они могут быть обязательны к выполнению, либо достаточно удовлетворения только некоторых из них (параметры «И» и «ИЛИ»). В построителе предусмотрена возможность установки условий для различных типов: текстовых, числовых, даты и времени, логических и т.д.

Настраиваемый фильтр

Удобным является такой способ фильтрации данных в MS Excel для числовых полей. Допустим, в нашем прайс-листе мы захотим найти средства для губ со стоимостью до 300-т рублей. В столбце «Тип косметики» выбираем флажками две позиции: «ПОМАДА» и «БЛЕСК ДЛЯ ГУБ».

В столбце «Цена» выбираем позицию «Числовые фильтры», в отличие от текстовых в столбце с типом косметики.

Выбираем из вариантов пункт «меньше или равно» и в открывшемся окне параметров выставляем сумму 300 руб. После нажатия на кнопку «ОК» получаем список из четырех средств типов «Помада» и «Блеск для губ» и стоимостью менее 300 рублей.

Фильтр по цене

Наконец, добавляем еще одно условие фильтрации данных – по цвету. Наш прайс-лист показывает примеры цветовой гаммы декоративной косметики. Воспользуемся этим и выберем средства для губ светло-розового оттенка. В меню столбца «Цветовая гамма» выбираем пункт «Фильтр по цвету», нажимаем в нем кнопку «Другие цвета ячеек», если предложенного выбора недостаточно, и выбираем желаемый оттенок. По кнопке «Ок» остаются только средства в нужном ценовом и цветовом диапазоне.

Сортировка и поиск информации

Даже после того, как лишние записи будут скрыты, их по-прежнему может оказаться много для выбора или анализа. В этом случае применяется еще одна удобная возможность MS Excel – сортировка. В уже изученном нами меню есть пункты, которые помогут выстроить элементы таблицы в необходимом порядке, облегчив, тем самым, поиск.

Упорядочивание элементов в столбце возможно, в зависимости от типа информации в нем. Для текстовых полей предлагается распределение от «А» до «Я» и в обратном направлении. Ее удобно применять, к примеру, для более удобного поиска по фамилии клиента, наименованию партнера и т.п.

Числовые поля сортируются по возрастанию и убыванию. Следует быть внимательными в случае, если числа внесены в столбец как текст. В этом случае они будут упорядочены как текст, то есть, числа 10, 11, 100, 12, 110 будут идти в таком порядке в зависимости от формата полей:

Сортировка в числовом формате Сортировка в текстовом формате
10 10
11 100
12 11
100 110
110 12

Записи упорядочиваются по ряду параметров. Для этого существует вариант настраиваемой сортировки в меню кнопка «Сортировка и фильтр». Вы выбираете, по каким полям сортировать, какого типа и в каком порядке применять:

Окно сортировки

В настраиваемых списках содержатся дни недели и месяцы, и пользователь может ввести собственный со своими элементами.

БД Access

Не менее полезна фильтрация в базах данных. В Access есть несколько вариантов получения необходимой информации: с помощью общих параметров, по конкретному значению, по форме и с помощью запросов.

На главной вкладке приложения вы найдете панель инструментов «Сортировка и фильтр». Кнопки на ней используются для совершения указанных операций. В Access используется тот же механизм, что в Excel. Остановимся более подробно на тех способах, с которыми мы еще не знакомы.

Способы

Общая фильтрация данных в Access реализуется так же, как и в MS Excel, с помощью выпадающего меню в заголовке столбца. По аналогии, выбирается один или несколько элементов из списка доступных или применяется селекция по типу информации в столбце.

Чтобы использовать в качестве параметра конкретное значение в ячейке, выделяют эту ячейку и выбирают меню «Выделение» на панели «Сортировка и фильтр» либо вызывают список доступных действий правым кликом. Возможности отбора зависят от типа, к которому принадлежит содержимое ячейки.

Фильтр по выделению

Фильтр по форме – простой способ нахождения записей с возможностью использования нескольких параметров. Он вызывается операцией «Дополнительно» — «Фильтр по форме». При этом создается пустая форма, на которой вы выставляете параметры, после чего нажимаете «Дополнительно» — «Применить». Теперь форма содержит только искомые записи.

Запросы для отбора данных

Дополнительным удобным средством фильтрации данных в БД являются запросы. Их создание требует времени и необходимых навыков, но запросы обладают рядом преимуществ. Прежде всего, однажды написав запрос на выборку и сохранив его, вы получаете механизм, который можно использовать постоянно для построения отчетов, вывода строк в формы, создания сложных перекрестных запросов и т.д.

В запросах можно использовать поля нескольких таблиц, добавив условия для получения данных по каждому из них. Эти объекты БД создаются с помощью Конструктора, мастера запросов или редактора SQL.

Запросы SQL на выборку имеют структуру вида

Select [список полей]

Здесь в блоке условий задаются параметры, по которым выбираются записи. Для примера составим запрос для выбора записей из таблицы “Товары по складам”. Пусть нам необходимо выбрать строки с вазами под наименованием «Восторг» и посмотреть, сколько товара с таким названием есть на каждом из складов.

SELECT [Товары по складам].[Тип товара], Вазы.Ваза, [Товары по складам].Склад, [Товары по складам].Количество

FROM Вазы INNER JOIN [Товары по складам] ON Вазы.Код = [Товары по складам].Наименование

WHERE (([Товары по складам].[Тип товара]=»Ваза») AND ([Вазы].[Ваза]=»Восторг»));

Результат будет выглядеть так:

Результат запроса

В режиме конструктора запрос имеет вид:

Конструктор запроса

Сохранение и последующее применение

Иногда возникает необходимость многократного использования однажды установленного отбора или его автоматического применения при запуске таблицы или формы. Сохранение условий происходит автоматически при закрытии объекта. При последующем его открытии отображаются все записи, и для того, чтобы снова применить сохраненное ограничение, нужно нажать кнопку «Фильтр» панели «Сортировка и фильтр».

Фильтр при загрузке

Для автоматического применения нужного отбора воспользуйтесь свойством объекта «Фильтр при загрузке», установив его в значение «Да»

Еще один способ сохранения и последующего использования – в качестве запроса. Для этого задают расширенные параметры. Настраивают необходимые поля для поиска, сортировку и фильтрацию данных и сохраняют в контекстном меню. Впоследствии его загружают из того же меню командой «Загрузить из запроса»

Фильтр как запрос

Поиск и выстраивание списка в Access

По аналогии с MS Excel, Access предоставляет пользователю возможность сортировки по столбцам, чтобы облегчить поиск нужной информации. Упорядочивание значений происходит по алфавиту для текста (в прямом и обратном порядке), по возрастанию и убыванию для числовой информации и дат. Можно применять ее по нескольким полям одновременно, что еще более помогает в задаче поиска нужных записей. Текстовые поля распределяются без учета регистра.

Для нахождения записи с вхождением нужной строки используется механизм поиска – кнопка «Найти» одноименной панели инструментов. В окне вносятся параметры поиска – строка, место, направление, часть поля, регистр.

Инструмент поиска

Механизмы сортировки, поиска и фильтрации данных в электронных таблицах и БД значительно упрощают работу с большими массивами информации. Если научиться пользоваться ими легко, использование этих инструментов станет привычным, ускорит и облегчит ежедневный труд.

Информация и ее свойства

Объекты материального мира находятся в состоянии непрерывного изменения, которое сопровождается обменом энергии. Все виды сопровождаются появлением сигналов. При взаимодействии сигналов с физическими телами в последних возникают определенные изменения свойств — это явление называется регистрацией сигналов.

Данные — это зарегистрированные сигналы.

Информация — это сведения об объектах и явлениях окружающей среды, их параметров, свойствах и состояниях, которые уменьшают имеющуюся в них степень неопределенности, неполноту знаний. Данные могут рассматриваться как записанные наблюдения, которые не используются, а пока хранятся.

Свойства информации, определяющие ее качества

Под качеством информации понимают степень её соответствия потребностям потребителей. Свойства информации являются относительным, так как зависят от потребностей потребителя информации. Выделяют следущие свойства, характеризующие качество информации:

  • Объективность информации характеризует её независимость от чьего-либо мнения или сознания, а также от методов получения. Более объективна та информация, в которую методы получения и обработки вносят меньший элемент субъективности.
  • Полнота. Информацию можно считать полной, когда она содержит минимальный, но достаточный для принятия правильного решения набор показателей. Как неполная, так и избыточная информация снижает эффективность принимаемых на основании информации решений. [1]
  • Достоверность — свойство информации быть правильно воспринятой[2]. Объективная информация всегда достоверна, но достоверная информация может быть как объективной, так и субъективной. Причинами недостоверности могут быть:
    • преднамеренное искажение (дезинформация);
    • непреднамеренное искажение субъективного свойства;
    • искажение в результате воздействия помех;
    • ошибки фиксации информации;

    В общем случае достоверность информации достигается:

      • указанием времени свершения событий, сведения о которых передаются;
      • сопоставлением данных, полученных из различных источников;
      • своевременным вскрытием дезинформации;
      • исключением искаженной информации и др.

      Также можно классифицировать свойства информации, характеризующие её качество, следующим образом [Акулов О. А., Медведев Н. В. Информатика: базовый курс. — М.: Омега-Л, 2004. С. 42.]:

      • Содержательность или внутреннее качество (качество, присущее собственно информации и сохраняющееся при её переносе из одной системы в другую)
        • Значимость (свойство сохранять ценность для потребителя с течением времени)
          • Полнота (свойство, характеризуемое мерой её достаточности для решения определенных задач)
          • Идентичность (свойство, заключающееся в соответствии информации состоянию объекта)
          • Избирательность
          • Гомоморфизм
          • Сохранность
          • Достоверность
          • Конфиденциальность

          Операции с данными

          Для повышения качества данные преобразуются из одного вида в другой с помощью методов обработки. Обработка данных включает операции:

          1) Ввод(сбор) данных — накопление данных с целью обеспечения достаточной полноты для принятия решений

          2) Формализация данных — приведение данных поступающих из разных источников, к одинаковой форме, для повышения их доступности.

          3) Фильтрация данных — это отсеивание «лишних» данных, в которых нет необходимости для повышения достоверности и адекватности.

          4) Сортировка данных — это упорядочивание данных по заданному признаку с целью удобства использования.

          5) Архивация — это организация хранения данных в удобной и легкодоступной форме.

          6) Защита данных — включает меры, направленные на предотвращение утраты, воспроизведения и модификации данных.

          7) Транспортировка данных — прием и передача данных между участниками информационного процесса.

          8) Преобразование данных — это перевод данных из одной формы в другую или из одой структуры в другую.

          Кодирование данных

          Для автоматизации работы с данными, которые относятся к различным типам, необходимо унифицировать их форму представления — состоящий в выражении данных одного типа, через данные другого типа. Системный код вычислительной техники — двоичное кодирование, основанное на предоставлении данных в виде последовательных двух знаков: 1 и 0. Эти знаки называются двоичными цифрами-binary digit или bit.

          Одним битом выражаются два понятия: 0 или 1.

          Двумя битами- четыре понятия: 00 ,01, 10, 11.

          Тремя битами — восемь понятий: 000,001,010,011,100,101,110,111

          Увеличение на единицу количества разрядов двоичной системы кодирования приводит к увеличению в 2 раза количества значений, которое может быть ими выражено. Общая форма N=2 m , где N — количество независимых кодируемых значений; m — разрядность двоичного кодирования.

          Кодирование целых и действительных чисел

          Алгоритм превода целых десятичных чисел в двоичные: 1) Разделить число на 2. Зафиксировать остаток (0 или 1) частное.

          2) Если частное не равно нулю, то разделить его на 2 и т.д. пока частное не станет равно 0. Если частное 0, то записать все полученные остатки, начиная с первого с права на лево.

          Чтобы получить обратную,надо проссумировать степени 2 соответа не нулевого разрядам записи числа.

          Для кодирования целых чисел: от 0 до 255 — 8 бит (восьмиразрядного двоичного ввода) от 0 до 655 — 16 бит от 0 до 16,5 млн — 24 бит

          Кодирование текстовых данных

          Если каждому символу алфавита сопоставить определенное целое или не целое число (например,порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию и звуковую. Восьми двоичных разрядов достаточно для кодирования 256 различных символов. Для того чтобы весь мир одинаково кодировал текстовые данные, нужны единые таблицы кодирования, а это пока невозможно из-за противоречий между символами национальных алфавитов, а также противоречий корпоративного характера.

          Для английского языка, захватившего де-факто нишу международного средства общения, противоречия уже сняты. Институт стандартизации США (ANSI — American National Standard Institute) ввел в действие систему кодирования ASCII (American Standard Code for Information Interchange — стандартный код информационного обмена США).В системе ASCII закреплены две таблицы кодирования — базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255. В СССР в этой области действовала система кодирования КОИ-7 (код обмена информацией, семизначный). Однако поддержка производителей оборудования и программ вывела американский код ASCII на уровень международного стандарта.

          Предмет и задачи информатики

          Информатика — это техническая наука, систематизирующая приемы создания, хранения, воспроизведения, обработки и передачи данных средствами вычислительной техники, а также принципы функционирования этих средств и методы управления ими.

          Предмет информатики составляют следующие понятия:

          • аппаратное обеспечение средств вычислительной техники;

          • программное обеспечение средств вычислительной техники;

          • средства взаимодействия аппаратного и программного обеспечения;

          • средства взаимодействия человека с аппаратными и программными средствами.

          В информатике особое внимание уделяется вопросам взаимодействия. Для этого даже есть специальное понятие — интерфейс. Методы и средства взаимодействия человека с аппаратными и программными средствами называют пользовательским интерфейсом. Соответственно, существуют аппаратные интерфейсы, программные интерфейсы и аппаратно-программные интерфейсы.

          В составе основной задачи информатики сегодня можно выделить следующие направления для практических приложений:

          • архитектура вычислительных систем (приемы и методы построения систем, предназначенных для автоматической обработки данных);

          • интерфейсы вычислительных систем (приемы и методы управления аппаратным и программным обеспечением);

          • программирование (приемы, методы и средства разработки компьютерных программ); „

          • преобразование данных (приемы и методы преобразования структур данных);

          • защита информации (обобщение приемов, разработка методов и средств защиты данных);

          • автоматизация (функционирование программно-аппаратных средств без участия человека);

          • стандартизация (обеспечение совместимости между аппаратными и программными средствами, а также между форматами представления данных, относящихся к различным типам вычислительных систем).

          Ссылки

          • Информатика.базовый курс. Под редакцией С.В. Симановича 2004

          Wikimedia Foundation . 2010 .

          Данные

          Да́нные (калька от англ. data [источник не указан 101 день] ) — представление фактов и идей в формализованном виде, пригодном для передачи и обработки в некотором информационном процессе.

          Изначально — данные величины, то есть величины, заданные заранее, вместе с условием задачи. Противоположность — переменные величины.

          В информатике данные — это результат фиксации, отображения информации на каком-либо материальном носителе, то есть зарегистрированное на носителе представление сведений независимо от того, дошли ли эти сведения до какого-нибудь приёмника и интересуют ли они его. [1]

          Данные — это и текст книги или письма, и картина художника, и ДНК.

          Данные, являющиеся результатом фиксации некоторой информации, сами могут выступать как источник информации. Информация, извлекаемая из данных, может подвергаться обработке, и результаты обработки фиксируются в виде новых данных.

          Данные могут рассматриваться как записанные наблюдения, которые не используются, а пока хранятся.

          Информация, отображаемая данными, может быть непонятна приемнику (шифрованный текст, текст на неизвестном языке и пр.).

          В обществе

          В информатике

          Основная статья: Данные (вычислительная техника)

          С точки зрения программиста, данные — это часть программы, совокупность значений определённых ячеек памяти, преобразование которых осуществляет код. С точки зрения компилятора, процессора, операционной системы, это совокупность ячеек памяти, обладающих определёнными свойствами (возможность чтения и записи (необяз.), невозможность исполнения).

          Контроль за доступом к данным в современных компьютерах осуществляется аппаратно.

          В соответствии с принципом фон Неймана, одна и та же область памяти может выступать как в качестве данных, так и в качестве исполнимого кода.

          Типы данных

          Традиционно выделяют два типа данных — двоичные (бинарные) и текстовые.

          Двоичные данные обрабатываются только специализированным программным обеспечением, знающим их структуру, все остальные программы передают данные без изменений.

          Текстовые данные воспринимаются передающими системами как текст, записанный на каком-либо языке. Для них может осуществляться перекодировка (из кодировки отправляющей системы в кодировку принимающей), заменяться символы переноса строки, изменяться максимальная длина строки, изменяться количество пробелов в тексте.

          Передача текстовых данных как бинарных приводит к необходимости изменять кодировку в прикладном программном обеспечении (это умеет большинство прикладного ПО, отображающего текст, получаемый из разных источников), передача бинарных данных как текстовых может привести к их необратимому повреждению.

          Данные в объектно-ориентированном программировании

          Могут обрабатываться функциями объекта, которому принадлежат сами, либо функциями других объектов, имеющими для этого возможность.

          Данные в языках разметки

          Имеют различное отображение в зависимости от выбранного способа представления.

          Данные в XML

          В теории множеств

          В отличие от операций над элементами множества, представляют собой множество (название и элементы множества)

          В лингвистике

          В отличие от операций (действие, процесс) по работе с данными (сказуемое с возможными его обстоятельствами и дополнениями), выражаются подлежащим (с возможными его определениями).

          Метаданные

          Множество данных может иметь надмножество, называемое метаданными. Другими словами, метаданные — это данные о данных.

          Операции с данными

          Для повышения качества данные преобразуются из одного вида в другой с помощью методов обработки. Обработка данных включает операции:

          1. ввод (сбор) данных — накопление данных с целью обеспечения достаточной полноты для принятия решений;
          2. формализация данных — приведение данных, поступающих из разных источников, к одинаковой форме, для повышения их доступности;
          3. фильтрация данных — это отсеивание «лишних» данных, в которых нет необходимости для повышения достоверности и адекватности;
          4. сортировка данных — это упорядочивание данных по заданному признаку с целью удобства их использования;
          5. архивация — это организация хранения данных в удобной и легкодоступной форме;
          6. защита данных — включает меры, направленные на предотвращение утраты, воспроизведения и модификации данных;
          7. транспортировка данных — приём и передача данных между участниками информационного процесса;
          8. преобразование данных — это перевод данных из одной формы в другую или из одной структуры в другую.

          Примечания

          1. Максимович Г. Ю. Информационные системы : Учебное пособие / Ю. Г. Максимович, А. Г. Романенко, О. Ф. Самойлюк; Под общей ред. К. И. Курбакова. — М .: Изд-во Рос. экон. акад., 1999. — 198 с.

          См. также

          Это заготовка статьи о компьютерах. Вы можете помочь проекту, исправив и дополнив её.
          Это примечание по возможности следует заменить более точным.
          • Найти и оформить в виде сносок ссылки на авторитетные источники, подтверждающие написанное.
          • Проставив сноски, внести более точные указания на источники.
          • Данные

          Wikimedia Foundation . 2010 .

          Фильтрация данных в диапазоне или таблице

          Браузер не поддерживает видео.

          Используйте фильтры, чтобы временно скрывать некоторые данные в таблице и видеть только те, которые вы хотите.

          Фильтрация диапазона данных

          1. Выберите любую ячейку в диапазоне данных.
          2. Выберите Данные >Фильтр. Кнопка
          3. Выберите стрелку в столбце Стрелка фильтра.
          4. Выберите пункт Текстовые фильтры или Числовые фильтры, а затем — сравнение, например пункт Между. Числовые фильтры
          5. Введите условия фильтрации и нажмите кнопку ОК. Диалоговое окно

          Фильтрация данных в таблице

          При создании и формате таблицв их заглавные таблицы автоматически добавляются элементы управления фильтром.

          Таблица Excel со встроенными фильтрами

          Коллекция фильтров

          1. Выберите стрелку в столбца, который вы хотите отфильтровать.
          2. Снимите флажок (Выделить все) и установите флажки для тех элементов, которые вы хотите отобразить.
          3. Нажмите кнопку ОК.

          Стрелка заглавного изменится на фильтра. Щелкните этот значок, чтобы изменить или очистить фильтр.

          Добавить комментарий

          Ваш адрес email не будет опубликован. Обязательные поля помечены *