EN

Data Engineering 101

Комплексна програма з інженерії даних для розробників-світчерів та спеціалістів по роботі з даними

Дізнатись більше про програму

Data Engineering 101

Старт програми: 11 березня
Тривалість: 12 тижнів
Дедлайн подачі: 10 березня
Формат: онлайн
ECTS: 4
Мова: Англ / Укр
Вартість: 12 800 ₴ / місяць

Огляд програми

Сьогодні кожен бізнес — data driven. Попит на спеціалістів по роботі з даними лише зростає. Саме тому ми розробили цю програму — мікромагістратуру з фундаментальними знаннями про зберігання, обробку і отримання даних. 

 

Протягом 3 місяців ви вчитиметеся роботі з даними — від запитів у SQL до координації та моніторингу. Після навчання зможете претендувати на позицію Junior Data Engineer (якщо ви світчер), або закріпитися у цій ролі (якщо ви вже in). 

ЩО ВИ ВИВЧИТЕ

SQL та NoSQL
PySpark для потокової та пакетної обробки даних
збір даних з різних джерел (файлові системи, обʼєктні сховища, API та потоки подій)
впровадження ефективних стратегій інтеграції даних
Airflow, Prometheus та Grafana для автоматизації роботи з даними

ВИМОГИ ДО УЧАСНИКІВ

базове розуміння Python

базове розуміння SQL

базове розуміння Docker

знання англійської не нижче B1

ОСВІТНІ МОДУЛІ

Модуль 0. Пререквізити та вступ в інженерію даних

Цей модуль присвячено ознайомленню з ключовими поняттями інженерії даних та структуризації знань:

  • інтро у дата-інженерію: чому це не просто бекенд
  • Python: масиви, класи, функції
  • SQL, реляційні СУБД (RDBMS), запити
  • Docker: контейрени, образи, контроль версій

Модуль 1. Зберігання даних

У цьому модулі ви ознайомитеся з основними принципами зберігання даних:

  • Види баз даних і ключові відмінності
  • Реляційні БД (SQL)
  • Нереляційні БД (NoSQL)
  • Формати даних і зберігання в об'єктних сховищах
  • Data Modeling

Модуль 2. Обробка даних

Цей модуль присвячено основним підходам та інструментам обробки даних:

  • Потокова обробка (Stream)
  • Пакетна обробка (Batch)
  • Використання інструменту PySpark
  • Spark SQL

Модуль 3. Отримання даних

На цьому модулі ви навчитеся збирати та організовувати дані з різних джерел:

  • Організація даних на файлових системах та об'єктних сховищах
  • Інструменти для збору даних пакетної обробки (PySpark, airbyte)
  • Основи REST API
  • Потік подій

Модуль 4. Координація та моніторинг

У цьому модулі ви дізнаєтеся, навіщо і як оркеструвати, координувати і моніторити дані за допомогою різних інструментів

  • Робота з Airflow: скрипти DAG, вузли, параметри
  • Інструмент для моніторингу Prometheus
  • Інструмент візуалізації Grafana

Куратор та викладач

Дмитро Приймак

Інженер з більш ніж 10-річним професійним досвідом у проектуванні та створенні систем для розподіленої обробки даних. Протягом кар’єри Дмитро працював над численними проектами, що охоплюють сфери страхування, охорони здоров’я, обробки медичних даних, онлайн-медіа та розваг. В останні роки змістив свій фокус з виключно інжинірингу на керівництво командами та наставництво/коучинг.

Дмитро також є запрошеним викладачем в SET University, де викладає курс Big Data на магістерських програмах.

ПЕРЕВАГИ

Програма надає необхідні навички та знання для старту карʼєри в одному з найзатребуваніших напрямів в ІТ

гнучкий формат навчання, який можна поєднувати з full-time роботою

вас навчають експерти-практики, які нададуть релевантні фідбеки та якісну підтримку під час навчання

ДЛЯ КОГО

Розробники, які прагнуть розвиватися в напрямі інженерії даних

Data Scientists та Data Analysts, які прагнуть перейти на позицію Data Engineer

Junior Data Engineers, які хочуть систематизувати свої знання та ефективно використовувати інструменти по роботі з даними

FAQ

Я вже працюю як дата-інженер, чи є сенс йти на ваш курс?

Якщо ви працюєте на цій позиції рік або менше — так, адже на цьому курсі ви зможете структурувати знання та заповнити пробіли у володінні певними інструментами.

Дізнайтесь детальніше про програму SET University

Я маю промокод
Дякуємо! Ми зв'яжемося з вами найближчим часом.

Маєте питання?

Отримати консультацію hello@setuniversity.tech

Ми використовуємо файли cookie, щоб покращити ваш досвід.