You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
big_data/L3 - Stream processing with...
Vladimir Protsenko 7b8f0c8baa File for streaming reference materials added. 2 years ago
..
README.md Update README.md 3 years ago
refs.md File for streaming reference materials added. 2 years ago

README.md

Лабораторная 3. Потоковая обработка в Apache Flink

В этой лабораторной вы будете работать с Apache Flink - фреймворком и движком распределённой обработки потоков данных.

Задание

Выполнить следующие задания из набора заданий репозитория https://github.com/ververica/flink-training-exercises:

  • RideCleanisingExercise
  • RidesAndFaresExercise
  • HourlyTipsExerxise
  • ExpiringStateExercise

Решения могут быть выполнены на двух языках: Java или Scala. Каждому заданию соответствует .java или .scala файл с шаблоном решения и файл с тестом решения. Тесты расположены в папке test.

Для выполнения заданий вам потребуется датасет с данными о поездках такси в Нью-Йорке https://github.com/apache/flink-training/blob/master/README.md#using-the-taxi-data-streams. Файлы nycTaxiFares.gz и nycTaxiRides.gz вы можете найти в папке data https://gitlab.com/ssau.tk.courses/big_data/-/tree/master/data.

Начало работы

  1. git clone https://github.com/ververica/flink-training-exercises
  2. Откройте проект в IntelliJ IDEA
  3. Перед выполнением заданий укажите путь к данным в переменных pathToRideData и pathToFareData в файле ./flink-training-exercises/src/main/java/com/ververica/flinktraining/exercises/datastream_java/utils/ExerciseBase.java.
  4. Для выполнения первого задания на Scala откройте файл ./flink-training-exercises/src/main/scala/com/ververica/flinktraining/exercises/datastream_scala/basics/RideCleansingExercise.scala. В месте решения вы найдёте throw new MissingSolutionException().
  5. Запустите тест ./flink-training-exercises/src/test/java/com/ververica/flinktraining/exercises/datastream_java/basics/RideCleansingScalaTest.java. Тест должен завершиться успешно, но сама программа будет завершаться аварийно с исключением MissingSolutionException.
  6. Реализуйте недостающий код. С помощью теста проверьте корректность работы вашего решения.

Зарегистрируйтесь на сайте https://training.ververica.com для доступа к теоретическим материалам и дополнительным упражнениям.