ANG - Модульная платформа для управления большими данными (Big Data)

ANG - это модульная платформа, разработанная для управления большими данными с использованием открытого программного обеспечения. Она может быть развернута как в облаке, так и on-premise, предоставляя возможность построения Data Lake, Data Mesh и Lakehouse.

Основные технологии

  • Организация потоковой передачи данных и интеграция: Kafka, NiFi, Flink.
  • Хранение данных: Iceberg, MINIO.
  • Горячий слой данных: ClickHouse.
  • Управление ресурсами: Kubernetes.
  • Веб-сервер и балансировщик нагрузки: NGINX.

Управление и мониторинг

  • Административная панель: Argument обеспечивает управление всеми компонентами платформы.
  • Мониторинг: Prometheus и Grafana.

Обработка данных

ETL-процессы выполняются с помощью Spark, Trino и Impala для выполнения распределённых вычислений, построения витрин данных и моделей.

Работа с данными

  • Визуализация и взаимодействие: Superset.
  • Управление доступом: Ranger и OpenSearch.