trends2022

Тенденції розвитку науки про дані у 2022 році

Розвиток таких технологій, як глибоке навчання, обробка природної мови, комп’ютерний зір, став можливим з появою науки про дані, як галузі вивчення та практичного застосування. Також це дозволило з’явитися машинному навчанню (ML).

Наука про дані – це розділ інформатики, який вивчає різні проблеми аналізу, обробки та представлення даних у цифровому форматі. Вона охоплює теоретичне та практичне застосування ідей, зокрема великих даних, прогнозної аналітики та Штучного Інтелекту. Ще 10 років тому наука про дані вважалася нішевим перехресним предметом, який поєднував статистику, математику та обчислення. Наразі її доступність зростає, а важливість бізнесу цілком зрозуміла та відома. Існує безліч способів познайомитися з нею, зокрема онлайн курси, навчання всередині компанії та ін. Розглянемо деякі тенденції розвитку науки про дані у 2022 році та наступному періоді.

Малі дані та TinyML

Великими даними частіше називають зростання обсягу цифрових даних, які щодня генеруються, збираються та аналізуються людиною. Алгоритми машинного навчання обробки великих обсягів даних також можуть бути досить великими. Так, найбільша та найскладніша система, яка здатна моделювати людську мову, GPT-3 складається з близько 175 мільярдів параметрів.

Машинне навчання може принести додаткову користь навіть у разі роботи у хмарних системах з необмеженою пропускною спроможністю. Саме тому виникла концепція «Малих даних», що дозволяє спростити швидкий когнітивний аналіз найважливіших даних у ситуаціях, коли час, пропускна здатність, витрати енергії мають важливе значення. Наприклад, автомобілі з автономним керуванням не можуть розраховувати на можливість відправлення та отримання даних із централізованого хмарного сервера при спробі уникнути ДТП.

TinyML відносяться до алгоритмів машинного навчання, що займають якнайменше місця і здатні працювати на малопотужному обладнанні поряд з місцем походження дії. У 2022 році кількість його появ у вбудованих системах (побутова техніка, автомобілі, промислове обладнання, сільськогосподарська техніка) зростатиме і зробить їх розумнішими та функціональнішими.

Якість обслуговування клієнтів на основі даних

Дані про клієнтів є основним джерелом компаній підвищення якості обслуговування клієнта: модернізація продукту чи послуги, спрощення процесу електронної комерції, створення зручнішого інтерфейсу, скорочення часу очікування тощо.

Взаємодія клієнта та компанії все більше стає цифровою. Будь-яку дію можна виміряти та проаналізувати для кращого розуміння, як можна покращити процеси, а також персоналізувати товари та послуги, що пропонуються клієнту. Пандемія спровокувала хвилю інвестицій та інновацій у технології онлайн комерції. Підприємства прагнули повністю замінити фізичні походи за покупками. Пошук нових методів та стратегій використання даних для покращення системи обслуговування клієнтів залишиться однією з головних тенденцій 2022 року.

Deepfake, генеративний ШІ, синтетичні дані

Deepfake – це реалістична заміна фото-, відео-, аудіо контенту, в основі якого лежить генеративний ШІ. Ця технологія має широке поширення у сфері мистецтва та розваг. У 2022 році очікується поширення дипфейків в інших галузях та сценаріях використання. Наприклад, створення синтетичних даних для навчання алгоритмів машинного навчання. За допомогою створення синтетичних облич неіснуючих людей з метою навчити алгоритми розпізнавання облич. Зокрема це дозволить уникнути проблем із конфіденційністю та використанням облич реальних людей. Також застосування цієї технології можливе в медицині (наприклад, для навчання систем розпізнавання ознак рідкісних видів онкозахворювань); для перетворення мови на зображення (наприклад, створення зображення будівлі за словесним описом його виду).

Конвергентність

Ключовими елементами цифрової трансформації є Штучний Інтелект (AI), Інтернет речей (IoT), хмарні обчислення, надшвидкі мережі (5G). Кожна з перерахованих технологій існує окремо, але вони пов’язані між собою, дозволяючи робити більше. Наприклад, ШІ дозволяє пристроям IoT діяти розумно, взаємодіяти з іншими технологіями за мінімальної участі людини, сприяючи автоматизації та створенню розумних будинків, підприємств та навіть міст. Крім того, що 5G та інші надшвидкі мережі дозволяють передавати дані на більш високих швидкостях, вони також дозволять стати звичайним явищем завдяки новим типам передачі даних. Алгоритми ШІ грають ключову роль маршрутизації трафіку з метою забезпечення оптимальної швидкості передачі, автоматизації контролю середовища хмарних центрів обробки даних. У 2022 році спостерігатиметься розвиток цих технологій та їхня взаємодія один з одним.

AutoML

AutoML (автоматизоване машинне навчання) сприяє демократизації науки даних. Очищення та підготовка даних – рутинна робота фахівця з даних, яка забирає багато часу. AutoML передбачає автоматизацію таких завдань. Мета цієї технології полягає у створенні інструментів та платформ, які зможе використовувати кожен. Таким чином, за допомогою зручних інтерфейсів кожен користувач зможе застосувати машинне навчання для вирішення проблем та перевірки ідеї. За прогнозами у 2022 році AutoML активно розвиватиметься.

Тенденції розвитку хмарних обчислень у 2022 році

З появою пандемії світ змінився, робота стала віртуальнішою, підприємства адаптувалися до нових умов та зосередили свою увагу на наданні цифрових послуг. Внаслідок цього за останні 2 роки хмарні обчислення значно зросли, і продовження їхнього розвитку спостерігатиметься у 2022 році.

Ймовірно, акцент з розгортання хмарних інструментів та платформ буде зміщений на впровадження більш цілісних стратегій, орієнтованих на міграцію до хмари всього підприємства. Як і раніше, розширення можливостей віддаленої та гібридної робочої сили буде у пріоритеті.

Нові сценарії використання

2020 року всесвітні витрати на хмарні сервіси склали 313 мільярдів доларів. Згідно з прогнозами Gartner у 2022 році витрати становитимуть 482 мільярди доларів. Основою процесу доставки практично будь-якої цифрової послуги (соціальні мережі, стрімінг, автомобіль із мережевими можливостями, Інтернет речей тощо) є інфраструктура хмарних обчислень. Надшвидкі мережі (5G і WI-Fi 6E) крім передачі ще більшої кількості даних з хмари, передаватимуть нові типи даних. Поява хмарної віртуальної реальності (VR/AR) сприятиме зменшенню гарнітури у розмірах та вартості. Хмарні технології роблять інші технології більш швидкими, легкими та доступними для користувача. Це ключовий фактор переходу сервісів на хмарні платформи.

Екологічна безпека стає рушійним фактором розвитку хмарних сервісів

Нині відбуваються суттєві зміни клімату. Кожна відповідальна компанія має брати участь у вирішенні екологічних проблем. Найчастіше у сфері технологій це зводиться до скорочення споживання енергії, яке пов’язане з високими вимогами до цифрових сховищ, наданням користувачам цілодобових послуг, потужнішими процесорами. У 2022 році технологічні гіганти планують направити інвестиції у вирішення таких проблем.

Гібридна хмара стирає межу між загальнодоступною та приватною хмарою

Традиційно компанії, які переходили в хмару, мали 2 варіанти: загальнодоступне або приватне хмарне рішення. Останнє характеризується можливістю більш гнучкого налаштування, організація має практично свою окрему хмару, інформація з якої не повинна виходити за її межі. У деяких випадках таке рішення обґрунтоване та корисне. Проте, великі провайдери хмарних рішень Microsoft, IBM, Amazon розвивають та просувають гібридні моделі, використовуючи найкраще з обох варіантів. У цьому випадку дані, що часто використовуються користувачами (наприклад, клієнтами), можуть зберігатися на загальнодоступних сервера, доступ до яких відкривається за допомогою програм, інформаційних панелей. На приватних серверах може зберігатися важлива та конфіденційна інформація. Доступ до цих даних може повністю контролюватись та оброблятися за допомогою спеціального додатка.

Наразі багато компаній намагаються освоїти хмарні обчислення, що стало ще однією причиною популярності гібридної хмари. Компанії розуміють всі переваги хмари та перебувають у пошуках додаткових варіантів використання. Багато компаній це призвело до «мультихмарного середовища» з використанням низки послуг від кількох постачальників. Варіант із використання гібридної хмари може спростити цей процес завдяки оптимізації взаємодії з користувачем.

Штучний Інтелект у хмарних обчисленнях

У процесі надання послуг Штучного Інтелекту ключову роль відіграють хмарні обчислення. Необхідність платформ Машинного Навчання у великій обчислювальній потужності та пропускній здатності даних для навчання та обробки можуть покрити хмарні центри обробки даних. Щодня ми стикаємося з послугами ШІ (Google пошук, фільтри в Instagram та ін.), що знаходяться у хмарі. Технологія, що розподіляє трафік із центру обробки та зберігання даних за пристроями користувачів, ґрунтується на машинному навчанні. Розвиток ШІ та хмарних обчислень пов’язані, і в наступні роки стане більш актуальним.

Безсерверна хмара

Зараз на ринку набирає обертів нова концепція – безсерверна хмара. Основними постачальниками є такі компанії, як Microsoft (Azure Function), IBM Cloud Function, Amazon (AWS Lambda). Ця концепція полягає в тому, що компанії не прив’язані до оренди серверів та оплати певного обсягу сховища. Оплата відбувається за використанням, водночас інфраструктура масштабується в міру того, як цього вимагає програма. Безумовно, сервер існує. Однак, додається ще один рівень між користувачем та платформою, що дозволяє користувачеві не торкатися налаштувань та технічних деталей.

GoUp Chat