You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

1.8 KiB

Материалы курса "Большие данные" 2024 (бакалавры)

График выполнения и форма отчётности

Время Лабораторная работа Форма отчётности
Февраль Введение в Mapreduce jupyter ноутбук с выполненными заданиями
Март Введение в Apache Spark jupyter ноутбук или проект с выполненными заданиями и отчёт
Апрель Формирование отчётов в Apache Spark jupyter ноутбук или скрипт/проект и отчёт
Май Потоковая обработка в Apache Flink проект с выполненными заданиями и отчёт (с зелёными тестами)

Spark лабораторные могут выполняться в Google Colab, наподобие того, как это сделано здесь https://colab.research.google.com/drive/1G894WS7ltIUTusWWmsCnF_zQhQqZCDOc.

В заданиях используйте выборки данных из папки data .

Для сдачи выкладывайте решения в репозиторий на github (или иной хостинг на основе системы контроля версий). Защита проходит онлайн в виде проверки выполнения заданий и 1-2 вопросов по каждой лабораторной.