Для того щоб прийняти правильне рішення при виборі системи організації даних доцільно провести порівняльний аналіз можливих варіантів.
Ключові відмінності між базами даних та сховищем даних:
Сховище даних
- зберігає зведені дані;
- використовується для аналізу даних;
- зберігання історичних та поточних даних;
- надання інформації з різних джерел;
- подання інформації щодо спільних бізнес-операцій;
База даних
- використовує деталізовані дані;
- фіксація транзакцій;
- зберігання поточних даних;
- збирання даних з одного джерела;
- фіксація основних повсякденних операцій;
Ключові відмінності між вітриною даних та сховищем даних:
Вітрина даних
- є тематичними підмножинами даних, які були вилучені зі сховища даних (зазвичай розмір становить менше 100 ГБ);
- є сховищем цінних даних для певної підгрупи;
- швидкий аналіз даних;
- отримання даних із сховища даних;
Сховище даних
- значно більше за розміром (терабайт або більше);
- містить усі очищені дані щодо бізнес-підрозділів;
- отримання даних із баз даних;
Ключові відмінності між озером даних та вітриною даних
Озеро даних
- містить усі необроблені та нефільтровані дані організації;
- доцільно використовувати для більш широкого та глибокого аналізу необроблених даних;
- комплексне рішення, яке виступає як сховище даних, база даних та вітрина даних;
- наявність центрального архіву, де вітрини даних можуть зберігатися в різних областях користувача;
Вітрина даних
- містить фільтровані та структуровані дані для певного підрозділу;
- досить специфічні та дозволяють швидко та ефективно аналізувати релевантну інформацію;
- є одноразовим рішенням без виконання ETL процесу;
Ключові відмінності між озером даних та сховищем даних
Сховище даних
- зберігання очищених даних для створення структурованих моделей даних та звітів;
- використання ODS із транзакційних систем;
- призначений для користувачів, яким потрібно створювати аналітичні звіти;
Озеро даних
- зберігання всіх даних для організації;
- використання апаратних засобів, що дозволяє економічно зберігати великі обсяги даних (терабайти, петабайти);
- вилучення даних із усіх типів даних, зокрема, нетрадиційних типи даних (журнали веб-сервісу, активність у соцмережах, дані датчиків тощо);
- призначений для глибокого аналізу, що виходить за рамки тих даних, що зберігаються у сховищі;
Ключові відмінності між базами даних та вітриною даних
База даних
- є репозиторієм транзакційних даних (OLTP);
- фіксування всіх аспектів та активностей одного суб’єкта;
- містить сирі та необроблені дані;
- користувачі не взаємодіють із даними у базах даних;
- є першим кроком у процесі ETL;
Вітрина даних
- є сховищем аналітичних даних (OLAP);
- містить дані від кількох суб’єктів;
- містить оброблені та перевірені дані, що спрощує процес створення звітів;
- пряма взаємодія користувача з даними з вітрин даних;
- є останнім кроком у процесі ETL;
Ключові відмінності між базами даних та озером даних
База даних
- фіксація транзакційних даних, пов’язаних з однією темою;
- зберігає традиційні дані (текст, числа);
- не здійснює очищення даних, зберігає необроблені дані;
- виробляє експорт своїх даних на інший процес (операційне сховище даних);
- є першим кроком у процесі ETL
Озеро даних
- фіксація активності багатьох баз даних та інших розрізнених джерел даних;
- є можливість зберігати дані будь-якого типу (pdf-файли, зображення, звукові файли тощо);
- зберігає необроблені дані, проте реалізовується процедура очищення даних;
- виконує всю обробку даних (очищення та агрегація);
- опрацьовує всі аспекти процесу ETL