Exemplo de Processamento de Streaming com Kafka e Flink em Python

Este exemplo demonstra um fluxo básico de ponta a ponta para o processamento de dados em tempo real usando o Apache Kafka e o Apache Flink em Python.

Requisitos

Uso

Passo 1: Geração de Dados

Execute o script data_generator.py para gerar transações de vendas sintéticas e publicá-las em um tópico Kafka chamado financial_transactions. Ajuste os parâmetros do script conforme necessário.

python data_generator.py

Passo 2: Processamento de Streaming com Flink

Execute o script flink_stream_processor.py para consumir as transações financeiras do tópico Kafka, processá-las usando o Flink e publicar os resultados processados em um novo tópico Kafka chamado processed_transactions.

python flink_stream_processor.py

Script de Geração de Dados (`data_generator.py`)

Este script em Python gera transações de vendas aleatórias usando a biblioteca Faker e as publica em um tópico Kafka. Cada transação inclui detalhes como ID da transação, informações do produto, ID do cliente e método de pagamento.

Script de Processamento de Streaming com Flink (`flink_stream_processor.py`)

Este script em Python utiliza o Apache Flink para consumir transações financeiras do tópico Kafka financial_transactions, processa cada transação (neste caso, simplesmente adicionando um prefixo "Processado:") e publica os resultados no tópico Kafka processed_transactions.

Diagrama de Sequência: Processamento de Streaming com Kafka e Flink

sequenceDiagram
    participant DataGenerator
    participant KafkaBroker
    participant FlinkProcessor

    DataGenerator->>KafkaBroker: Gera transação e publica em 'financial_transactions'
    KafkaBroker->>FlinkProcessor: Consumir transações de 'financial_transactions'
    FlinkProcessor->>KafkaBroker: Processar transações e publicar em 'processed_transactions'

Observações

Certifique-se de configurar um servidor Kafka em localhost:9092 antes de executar os scripts.
Ajuste as configurações do servidor de bootstrap do Kafka (bootstrap.servers) e outros parâmetros conforme necessário nos scripts.

Sinta-se à vontade para personalizar os scripts e explorar recursos adicionais do PyFlink e do Confluent Kafka Python conforme necessário para o seu caso de uso específico.

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
ingestion-consumer-flink		ingestion-consumer-flink
workflow-synthetic-data		workflow-synthetic-data
.gitignore		.gitignore
Dockerfile		Dockerfile
Makefile		Makefile
README.md		README.md
docker-compose.yaml		docker-compose.yaml
requirements.txt		requirements.txt
teste.py		teste.py
teste2.py		teste2.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Exemplo de Processamento de Streaming com Kafka e Flink em Python

Requisitos

Uso

Passo 1: Geração de Dados

Passo 2: Processamento de Streaming com Flink

Script de Geração de Dados (`data_generator.py`)

Script de Processamento de Streaming com Flink (`flink_stream_processor.py`)

Diagrama de Sequência: Processamento de Streaming com Kafka e Flink

Observações

About

Uh oh!

Releases

Packages

Uh oh!

Languages

tiagornandrade/kafka-flink-python-stream

Folders and files

Latest commit

History

Repository files navigation

Exemplo de Processamento de Streaming com Kafka e Flink em Python

Requisitos

Uso

Passo 1: Geração de Dados

Passo 2: Processamento de Streaming com Flink

Script de Geração de Dados (data_generator.py)

Script de Processamento de Streaming com Flink (flink_stream_processor.py)

Diagrama de Sequência: Processamento de Streaming com Kafka e Flink

Observações

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Script de Geração de Dados (`data_generator.py`)

Script de Processamento de Streaming com Flink (`flink_stream_processor.py`)

Packages