Блог

Повернутися до всіх статей

Актуальні завдання інфраструктури даних

|

https://pixabay.com/illustrations/puzzle-problem-3d-task-solution-1721464/

Нові рішення та розробки з однієї сторони забезпечують доступність й простоту стека даних на підприємствах, з іншої сторони сприяють появі ще більшій кількості труднощів. Актуальна ситуація виглядає так: обсяг даних, який проходить через організацію, стрімко збільшується. Також збільшується кількість їхніх джерел, що пов’язано з появою великої кількості SaaS інструментів.

Сучасний стек даних здебільшого орієнтується на область транзакційних даних та аналітики. Однак, підприємства не обходяться лише одним пайплайном і мають їх декілька, які працюють одночасно. Окрім цього, є необхідність у технологіях потокової передачі, які наразі знаходяться на початкових стадіях розвитку.

Отже, такі інструменти, як Spark, Kafka, Pulsar будуть актуальними і надалі. Внаслідок цього потреба в інженерах по обробці даних, які здатні застосувати ці технології, також буде зростати.

Системи оркестрації мають доволі активний розвиток. Це підтверджується появою наступних фреймворків: Airflow, Luigi, Perfect, Dagster  та ін. Такі інструменти являють собою набір бібліотек з відкритим початковим кодом, які призначені для розробки, планування та моніторингу робочих процесів. Відмінною рисою є те, що інструмент написаний на мові програмування Python. Така особливість надає можливість створення й написання ланцюгів задач у візуальному режимі, а також написання програмного коду Python. Для візуалізації потокових даних використовується DAG (Directed Acyclic Graph).

З цього можна зробити висновок, що управління даними продовжує бути основною вимогою на підприємствах (через сучасний стек даних або конвеєр машинного навчання).

Попередній пост #maindatainfrastructuretrends

Попереднiй Пост Наступний Пост

Недавні пости

Матриця Рамсфелда як ефективний інструмент в процесі приняття рішень

Під час брифінгу, присвяченого війні в Іраку, Дональд Рамсфелд поділив інформацію на 4 категорії: відоме знане, відоме незнане, невідоме знане, невідо...

Читати далі

Вплив ШІ та машинного навчання на науку про дані

Штучний інтелект та машинне навчання сприяли просуванню науки про дані. Ці технології допомагають фахівцям з даних проводити аналіз, будувати прогнози...

Читати далі

Штучний Інтелект у сфері аналізу даних

Штучний Інтелект широко використовується у багатьох додатках, зокрема й для аналітики даних. В основному ШІ застосовується для аналізу великих наборів...

Читати далі
GoUp Chat