You cannot select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
|
|
|
|
|
|
|
|
|
# Лабораторная 3. Потоковая обработка в Apache Flink
|
|
|
|
|
|
|
|
|
|
## Задание
|
|
|
|
|
|
|
|
|
|
Выполнить следующие задания из набора заданий репозитория https://github.com/ververica/flink-training-exercises:
|
|
|
|
|
- RideCleanisingExercise
|
|
|
|
|
- RidesAndFaresExercise
|
|
|
|
|
- HourlyTipsExerxise
|
|
|
|
|
- ExpiringStateExercise
|
|
|
|
|
|
|
|
|
|
Решения могут быть выполнены на двух языках: **Java** или **Scala**. Каждому заданию соответствует `.java` или `.scala` файл с шаблоном решения и файл с тестом решения. Тесты расположены в папке `test`.
|
|
|
|
|
|
|
|
|
|
Для выполнения заданий вам потребуется датасет с данными о поездках такси в Нью-Йорке https://github.com/apache/flink-training/blob/master/README.md#using-the-taxi-data-streams. Файлы `nycTaxiFares.gz` и `nycTaxiRides.gz` вы можете найти в папке `data` https://gitlab.com/ssau.tk.courses/big_data/-/tree/master/data.
|
|
|
|
|
|
|
|
|
|
## Начало работы
|
|
|
|
|
|
|
|
|
|
1. git clone https://github.com/ververica/flink-training-exercises
|
|
|
|
|
2. Откройте проект в IntelliJ IDEA
|
|
|
|
|
3. Перед выполнением заданий укажите путь к данным в переменных `pathToRideData` и `pathToFareData` в файле `./flink-training-exercises/src/main/java/com/ververica/flinktraining/exercises/datastream_java/utils/ExerciseBase.java`.
|
|
|
|
|
4. Для выполнения первого задания на **Scala** откройте файл `./flink-training-exercises/src/main/scala/com/ververica/flinktraining/exercises/datastream_scala/basics/RideCleansingExercise.scala`. В месте решения вы найдёте `throw new MissingSolutionException()`.
|
|
|
|
|
5. Запустите тест `./flink-training-exercises/src/test/java/com/ververica/flinktraining/exercises/datastream_java/basics/RideCleansingScalaTest.java`. Тест должен завершиться успешно, но сама программа будет завершаться аварийно с исключением `MissingSolutionException`.
|
|
|
|
|
6. Реализуйте недостающий код. С помощью теста проверьте корректность работы вашего решения.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Зарегистрируйтесь на сайте https://training.ververica.com для доступа к теоретическим материалам и дополнительным упражнениям.
|