Очистка данных

Очистка данных

Очистка данных (англ. Data cleansing) — процесс выявления и исправления ошибок, несоответствий данных с целью улучшения их качества. Очистка данных является составной частью интеллектуального анализа данных.

Очистка данных выполняется с определенными наборами данных (в базах данных и файлах). Необходимость в очистке данных чаще всего возникает при интеграции различных информационных систем (хранилища данных, системы управления ресурсами предприятия, системы управления взаимодействием с клиентами).

Источники данных в различных системах часто находятся в разрозненном виде и в различных состояниях. Преобразования выполняются автоматически (в соответствии с набором правил) либо вручную (в интерактивном режиме).

Примеры областей исправления данных включают адреса, различную классификацию мета-данных. Например, в системе А пол пользователя определяется символами 1 и 2, где 1 — мужской и 2 — женский. В системе Б пол пользователя определяется символами М и Ж, где М — мужской и Ж — женский. При интеграции данных в двух системах необходимо преобразовать классификацию к единому виду.

Ссылки


Wikimedia Foundation. 2010.

Игры ⚽ Нужна курсовая?

Полезное


Смотреть что такое "Очистка данных" в других словарях:

  • очистка данных — — [http://www.iks media.ru/glossary/index.html?glossid=2400324] Тематики электросвязь, основные понятия EN data cleaning …   Справочник технического переводчика

  • очистка данных (исправление данных) — очистка данных Исправление данных при заполнении хранилища данных. [http://www.morepc.ru/dict/] Тематики информационные технологии в целом EN data scrubbing …   Справочник технического переводчика

  • очистка данных (в информационных технологиях) — очистка данных 1. Процедура обработки данных с целью повышения их качества или улучшения характеристик их представления. 2. Удаление ненужной информации с носителя данных. [Гипертекстовый энциклопедический словарь по информатике Э. Якубайтиса]… …   Справочник технического переводчика

  • Очистка диска — Компонент Microsoft Windows …   Википедия

  • очистка (в Service Manager 2010) — Безвозвратное удаление данных из хранилища данных. [http://systemscenter.ru/scsm help.ru/] EN groom To permanently remove data from the data warehouse. [http://systemscenter.ru/scsm help.ru/] Тематики информационные технологии в целом EN groom …   Справочник технического переводчика

  • Средство переноса данных Windows — В данной статье или разделе имеется список источников или внешних ссылок, но источники отдельных утверждений остаются неясными из за отсутствия сносок …   Википедия

  • Подземный центр обработки данных «Гризинькалнс» — Связать? Подземный центр обработки данных расположен в парке Гризинькалнс в Риге (Латвия), и принадлежит оператору …   Википедия

  • Хранилище данных (значения) — Это слово имеет следующие значения: Content repository программная система, сочетающая в себе СУБД, систему контроля версий и поисковую машину; Data Warehouse предметно ориентированная корпоративная база данных.     …   Википедия

  • Предотвращение выполнения данных — В данной статье или разделе имеется список источников или внешних ссылок, но источники отдельных утверждений остаются неясными из за отсутствия сносок …   Википедия

  • Data mining — Не следует путать с Извлечение информации. Data Mining (рус. добыча данных, интеллектуальный анализ данных, глубинный анализ данных)  собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее… …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»