diff --git a/data/nycTaxiFares.gz b/data/nycTaxiFares.gz new file mode 100644 index 0000000..c82a709 Binary files /dev/null and b/data/nycTaxiFares.gz differ diff --git a/data/nyctaxi.csv b/data/nycTaxiRides.gz similarity index 77% rename from data/nyctaxi.csv rename to data/nycTaxiRides.gz index f0e94bb..8c67b05 100644 Binary files a/data/nyctaxi.csv and b/data/nycTaxiRides.gz differ diff --git a/lab3/Л3 - Apache Flink.md b/lab3/Л3 - Apache Flink.md new file mode 100644 index 0000000..f44045b --- /dev/null +++ b/lab3/Л3 - Apache Flink.md @@ -0,0 +1,24 @@ + +# Лабораторная 3. Потоковая обработка в Apache Flink + +## Задание + +Выполнить следующие задания из набора заданий репозитория https://github.com/ververica/flink-training-exercises: + - RideCleanisingExercise + - RidesAndFaresExercise + - HourlyTipsExerxise + - ExpiringStateExercise + +Решения могут быть выполнены на двух языках: **Java** или **Scala**. Каждому заданию соответствует `.java` или `.scala` файл с шаблоном решения и файл с тестом решения. Тесты расположены в папке `test`. + +Для выполнения заданий вам потребуется датасет с данными о поездках такси в Нью-Йорке https://github.com/apache/flink-training/blob/master/README.md#using-the-taxi-data-streams. Файлы `nycTaxiFares.gz` и `nycTaxiRides.gz` вы можете найти в папке `data` https://gitlab.com/ssau.tk.courses/big_data/-/tree/master/data. + +Начало работы: + +1. git clone https://github.com/ververica/flink-training-exercises +2. Откройте проект в IntelliJ IDEA +3. Для выполнения первого задания на *Scala* откройте файл `./flink-training-exercises/src/main/scala/com/ververica/flinktraining/exercises/datastream_scala/basics/RideCleansingExercise.scala`. В месте решения вы найдёте `throw new MissingSolutionException()`. +4. Запустите тест `./flink-training-exercises/src/test/java/com/ververica/flinktraining/exercises/datastream_java/basics/RideCleansingScalaTest.java`. Тест должен завершиться успешно, но сама программа будет завершаться аварийно с исключением `MissingSolutionException`. +5. Реализуйте недостающий код. С помощью теста проверьте корректность работы вашего решения. + +Зарегистрируйтесь на сайте https://training.ververica.com для доступа к теоретическим материалам и дополнительным упражнениям. \ No newline at end of file diff --git a/lab3/Л3 - Apache Flink.txt b/lab3/Л3 - Apache Flink.txt deleted file mode 100644 index 30ebd55..0000000 --- a/lab3/Л3 - Apache Flink.txt +++ /dev/null @@ -1,24 +0,0 @@ - -Лабораторная 3. Потоковая обработка в Apache Flink - -Задание: - -Выполнить все задания на https://training.ververica.com - - -Начало работы: - -1. git clone https://github.com/ververica/flink-training-exercises -2. Откройте папку в IntelliJ IDEA -3. Следуйте инструкциям на сайте https://training.ververica.com - - -Каждому заданию соответствует файл с шаблоном решения и файл с тестами решения: - - RideCleanisingExercise - - RidesAndFaresExercise - - HourlyTipsExerxise - - ExpiringStateExercise - -Решения могут быть выполнены на двух языках: Java, Scala. - -Тесты расположены в папке test.