Алгоритм ETL - технології інтеґрації даних

Для попередньо отриманих і збережених у оперативному сховищі даних нобхідно розробити систему норм і критеріїв перетворення їх до форми, придатної для збереження у сховищі даних. Приклади критеріїв та вимог:

  • обмеження часового періоду фактів "від ... – до ...", наприклад, вибір даних за останній місяць;
  • SELECT * FROM documents WHERE evdate>=DateDiff("d",Now(),30);

  • обов'язкове значення виміру, чи показника факту;

    SELECT * FROM documents WHERE document_type IS NOT Null;

  • входження значень виміру у попередньо визначену множину чи область визначення;
  • SELECT * documents WHERE delp_id In (select id from department where prior_id is Not Null);

  • унікальність значень;
  • дотримання правил синтаксису;
  • семантичні обмеження.
  • З метою аналізу, фільтрації та перетворення вхідних даних необхідно сформувати та виконати стосовно таблиці фактів оперативного сховища даних запити на вилучення або зміну даних, які не відповідають критеріям, розглянутим вище:

  • вилучення даних, які не містять обов'язкових значень і, внаслідок цього не можуть бути застосовані у сховищі даних:
  • DELETE * FROM documents WHERE id not in (SELECT id from documents_type);

  • виправлення некоректних чи помилкових значень (наприклад, коли у джерелах даних внесено не коди підрозділів, а назви).
  • З метою завантаження таблиці фактів необхідно створити та виконати запит (процедуру) переміщення значень з підготованої таблиці вхідних даних сховища оперативних даних у таблицю фактів та провести аналіз виконаних дій:

  • підготовка вхідних даних: внести зміни в склад, структуру і зміст джерел даних (по мірі потреби доповнити новими стовпчиками, вилучити зайві чи змінити параметри стовпчика, внести відсутні значення), узгодивши їх відповідності з таблицею метаданих та структурою оперативного сховища даних;
  • створити таблицю ОСД;
  • приєднати визначені джерела даних в якості зовнішніх таблиць;
  • сформувати та реалізувати запити (процедури) для перенесення даних зовнішніх джерел в оперативне сховище даних
  • З метою аналізу та верифікації сховища даних необхідно перевірити та обґрунтувати працездатність сховища даних. Для цього:

  • перевірити наявність всіх необхідних значень у стовпчиках таблиці фактів за таким алгоритмом:
  • 1) визначити кількість даних в джерелах,

    2) додати отримані кількості записів,

    3) визначити кількість вставлених у таблицю сховища записів (дата внесення цих записів рівна сьогоднішній),

    4) якщо суми рівні, то ETL пройшов без перешкод;

  • перевірити таблицю фактів на наявність "підвішених" рядків, що виникають при наявності в ній значень кодів, відсутніх у таблицях вимірів;
  • перевірити таблицю фактів на наявність повторюваних рядків:
  • визначаємо записи, що повторюються,
    визначені записи знищуємо, залишивши один з них;
  • виконати тестові запити на отримання контрольних підсумкових значень, таких як підрахунок кількості фактів по певному виміру, сумарного значення по певному виміру, тощо і звірити отримані результати з фактичними
  • на підставі отриманих результатів зробити висновки про придатність чи непридатність побудованого сховища даних до застосування.
  • Post new comment

    The content of this field is kept private and will not be shown publicly.
    • Allowed HTML tags: <h1> <h2> <h3> <h4> <h5> <h6> <address> <em> <strong> <code> <del> <cite> <acronym> <blockquote> <q> <sub> <p> <br> <pre> <ul> <ol> <li> <dl> <dt> <dd> <a> <b> <u> <i> <table> <tr> <td> <th> <div> <sup><hr> <img>
    • Glossary terms will be automatically marked with links to their descriptions.
    • Lines and paragraphs break automatically.

    More information about formatting options

    CAPTCHA
    This question is for testing whether you are a human visitor and to prevent automated spam submissions.
     888       888  888       8888888888      d8888              .d8888b.    d888    8888888b.  
    888 o 888 888 d88P d8P888 d88P Y88b d8888 888 Y88b
    888 d8b 888 888 d88P d8P 888 Y88b. 888 888 888
    888 d888b 888 88888b. d88P d8P 888 .d88b. "Y888b. 888 888 d88P
    888d88888b888 888 "88b 88888888 d88 888 d88P"88b "Y88b. 888 8888888P"
    88888P Y88888 888 888 d88P 8888888888 888 888 "888 888 888 T88b
    8888P Y8888 888 d88P d88P 888 Y88b 888 Y88b d88P 888 888 T88b
    888P Y888 88888P" d88P 888 "Y88888 "Y8888P" 8888888 888 T88b
    888
    Y8b d88P
    "Y88P"
    Enter the code depicted in ASCII art style.

    © Інформаційні технології. Аналітика , Рідна Мережа