You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
 
 
Vladimir Protsenko 5b947c1b0e Update 'README.md' 2 years ago
L0 - Introduction to MapReduce data processing model Update README.md 4 years ago
L1 - Introduction to Apache Spark Update 'L1 - Introduction to Apache Spark/L1_interactive_bike_analysis_python_with_rdd.ipynb' 2 years ago
L2 - Reports with Apache Spark Clarification of lab 2 task. 3 years ago
L3 - Stream processing with Apache Flink Added link to more real-world exercises with Flink. 2 years ago
L4 - ZooKeeper CMU Two-phase commit link explanation 2 years ago
data Added DataFrame/SQL examples. Introduced two errors in first two rows of trips dataset to practice with non-available values. 3 years ago
.gitignore Added python path. 3 years ago
QnA.md Update QnA.md 4 years ago
README.md Update 'README.md' 2 years ago

README.md

Материалы курса "Большие данные" 2022

График выполнения и форма отчётности

Время Лабораторная работа Форма отчётности
Сентябрь Введение в Apache Spark проект с выполненными заданиями и отчёт
Октябрь Формирование отчётов в Apache Spark скрипт/проект и отчёт
Ноябрь Потоковая обработка в Apache Flink проект с выполненными заданиями и отчёт (с зелёными тестами)
Декабрь ZooKeeper проект и отчёт

Первые две лабораторные могут выполняться на оборудовании университета на сайте https://mapr.space. Пишите, для регистрации пользователя, преподавателю.

События

Архив событий

27-30 июня, Data + AI Summit NA 2022: https://databricks.com/dataaisummit/north-america-2022
26-28 октября, Flink Forward Global 2021: https://www.youtube.com/playlist?list=PLDX4T_cnKjD0J2LFr7yBk2aSS_o2l-7ue
24-28 мая, Data + AI Summit NA 2021: https://www.youtube.com/playlist?list=PLTPXxbhUt-YVtufaAKCRfyPYsjgpq5DRL
9-12 декабря, SmartData 2020: https://www.youtube.com/playlist?list=PLeN_80lmoMY1ugdDLg2mWht5eQDq6CoNQ