Інтеґрація даних у сховищах даних

Необхідність інтеграції даних виникає через неоднорідність програмного середовища, розподілений характер організації, підвищені вимоги до безпеки даних, необхідність наявності багаторівневих довідників метаданих, потребу в ефективному зберіганні й опрацюванні дуже великих обсягів інформації.

Інтеґрація даних – це об'єднання даних, які спочатку вводяться в різні системи. Самі ці системи можуть розташовуватися в одній локальній мережі, але мати різні платформи і внутрішню архітектуру. Метою інтеґрації даних є отримання єдиної і цілісної картини корпоративних даних предметної області. Інтеґрація даних може бути описана за допомогою моделі, яка включає застосування, продукти, технології та методи.

Існує три основні методи інтеґрації даних: консолідація, федералізація і розповсюдження.

Консолідація даних – це збирання даних з територіально віддалених або різноплатформенних джерел даних в єдине сховище даних з метою їх подальшого опрацювання та аналізу.

У середовищі сховищ даних однією з найпоширеніших технологій підтримки консолідації є технологія ETL (витягання, перетворення і завантаження – extract, transform, and load). Ще одна поширена технологія консолідації даних ECM - керування змістом корпорації (enterprise content management). Більшість рішень ECM напрямлені на консолідацію і керування неструктурованими даними, такими як документи, звіти і web-сторінки.

Федералізація даних забезпечує єдину віртуальну картину одного або декількох первинних файлів даних. Процес федералізації даних завжди полягає у витяганні даних з первинних систем на підставі зовнішніх вимог. Всі необхідні перетворення даних здійснюються при їх витяганні з первинних файлів. Прикладом федералізації є інтеґрація корпоративної інформації (EII).

Застосування розповсюдження даних здійснюють копіювання даних з одного місця в інше. Ці застосування зазвичай працюють в оперативному режимі і здійснюють переміщення даних до місць призначення, тобто залежать від певних подій. Оновлення в первинній системі можуть передаватися в кінцеву систему синхронно або асихронно. Прикладами технологій, що підтримують розповсюдження даних, є інтеґрація корпоративних застосувань (Enterprise application integration, EAI) і тиражування корпоративних даних (Еnterprise data replication, EDR).

Методи, що використовуються застосуваннями інтеґрації даних, залежать як від потреб бізнесу, так і від технологічних вимог. Достатньо часто застосування інтеґрації даних використовує так званий гібридний підхід, який включає декілька методів інтеґрації. Приклад такого підходу – інтеґрація даних про клієнтів (customer data integration, CDI), метою якої є забезпечення узгодженої картини інформації про клієнтів.

© Інформаційні технології. Аналітика , Рідна Мережа