You cannot select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
1.8 KiB
1.8 KiB
Материалы курса "Большие данные" 2024 (бакалавры)
График выполнения и форма отчётности
Время | Лабораторная работа | Форма отчётности |
---|---|---|
Февраль | Введение в Mapreduce | jupyter ноутбук с выполненными заданиями |
Март | Введение в Apache Spark | jupyter ноутбук или проект с выполненными заданиями и отчёт |
Апрель | Формирование отчётов в Apache Spark | jupyter ноутбук или скрипт/проект и отчёт |
Май | Потоковая обработка в Apache Flink | проект с выполненными заданиями и отчёт (с зелёными тестами) |
Spark лабораторные могут выполняться в Google Colab, наподобие того, как это сделано здесь https://colab.research.google.com/drive/1G894WS7ltIUTusWWmsCnF_zQhQqZCDOc.
В заданиях используйте выборки данных из папки data .
Для сдачи выкладывайте решения в репозиторий на github (или иной хостинг на основе системы контроля версий). Защита проходит онлайн в виде проверки выполнения заданий и 1-2 вопросов по каждой лабораторной.