Henrique Ferreira
Engenharia de Dados & Business Intelligence
Compilação de projetos reais desenvolvidos nas áreas de Engenharia de Dados, Orquestração de Pipelines e Business Intelligence. Projetos em produção e projetos pessoais.
Apache Airflow 2.11 dbt Python Power BI SQL Server Docker PostgreSQL DAGs & Pipelines

⚠️ Aviso de sigilo: Projetos desenvolvidos em ambiente institucional (SES) têm seus dados sensíveis censurados nos prints para preservar o sigilo das informações. As imagens exibidas refletem a estrutura e funcionalidade das soluções, não os dados reais.


🏭 Projetos em Produção


1. Airflow — SES

Orquestração de pipelines de dados voltados para a área de saúde pública, utilizando Apache Airflow integrado ao ambiente da Secretaria de Estado de Saúde (SES).

O projeto contempla a automação de fluxos de ingestão, transformação e disponibilização de dados epidemiológicos e administrativos, garantindo confiabilidade, rastreabilidade e agendamento dos processos de forma visual e monitorada.

Tecnologias: Apache Airflow 2.11 · Python · DAGs · Saúde Pública

Airflow SES

⚠️ Os dados exibidos nos prints foram censurados para preservar o sigilo das informações institucionais da SES.


2. Pipeline — Fila On Time (SES)

Pipeline end-to-end para monitoramento de indicadores de tempo de espera em filas de atendimento da SES, com foco em condições como bronquiolite e outros agravos com metas de atendimento reguladas.

O projeto envolve:

Tecnologias: Apache Airflow 2.11 · Python · SQL · dbt Core 1.9 · Power BI · SES · Indicadores de Saúde

Estrutura do Pipeline

Etapa Tasks Paralelismo Função
Validação validate_database_connections Valida conexões com SER Produção e BI Dev
Extração processar_dados + processar_dados_gar Paralelo Extrai dados via OPENQUERY da origem
Staging stg_ser_on_time + stg_ser_on_time_gar Paralelo Modelos dbt no schema staging
Painéis 16 modelos dbt (UTI, Cardiologia, Infectologia, Especialidades) Paralelo entre si Schema paineis
KPI 3 modelos dbt (dashboard_solicitacoes, qtd_por_painel, solicitacoes_hoje_por_painel) Paralelo entre si Schema kpi
Relatório relatorio_final Consolida contagens de todas as tabelas via XComs
SPC verificar_spc_volume Non-blocking Monitora volume dos painéis; alerta por e-mail em caso de anomalia

Volumes típicos:

Agendamento: a cada 5 minutos (*/5 * * * *) · max_active_runs=1 · Criticidade ALTA

DAG Fila On Time

Hub On Time

On Time — Bronquiolite

🔄 Pipeline End-to-End

Abaixo o grafo completo de execução da DAG — da validação de conexões até o monitoramento estatístico via SPC, passando pela extração, transformação em dbt e geração dos 16 painéis de regulação médica.

⚠️ Os dados exibidos nos prints foram censurados para preservar o sigilo das informações institucionais da SES.


3. Painel BI — Monitoramento de Licitações (SUPCL / SES)

Painel de Business Intelligence desenvolvido para o monitoramento do setor de licitações da SES, com visão gerencial dos processos licitatórios em andamento e históricos.

O modelo de dados foi construído com arquitetura estrela (Star Schema), conectando-se a tabelas Excel organizadas em:

Essa modelagem garante performance nas consultas DAX e flexibilidade para cruzamentos analíticos entre as quatro frentes do setor de licitações.

A navegação do painel é feita pelos botões azuis no topo, que dão acesso a 9 páginas de detalhamento, cada uma explorando uma perspectiva específica dos dados de compras, licitações e contratos.

Tecnologias: Power BI · DAX · Star Schema · Excel · Modelagem Dimensional · SES

⭐ Star Schema Power BI — 4 Tabelas Fato modeladas

Star Schema — Modelo de Dados

SUPCL — Painel Licitações

⚠️ Os dados exibidos nos prints foram censurados para preservar o sigilo das informações institucionais da SES.


4. Monitoramento de Pipelines — SPC

DAG de observabilidade que roda diariamente monitorando a saúde estatística de todas as outras DAGs em produção.

Aplicá Controle Estatístico de Processo (SPC) sobre os volumes e métricas das pipelines, gerando um e-mail diário consolidado com o status de cada processo. Em caso de desvio estatístico significativo (anomalia de volume, falha recorrente ou comportamento fora dos limites de controle), o alerta é disparado imediatamente, antes mesmo do envio do relatório diário.

Isso garante visibilidade contínua sobre a confiabilidade do ambiente de dados em produção.

Tecnologias: Apache Airflow 2.11 · Python · SPC · E-mail · Monitoramento de Pipelines

SPC

E-mail SPC


🎓 Portfólio Pessoal


5. Data Warehouse — AWS

Construção de um Data Warehouse na nuvem AWS, com pipelines de dados orquestrados via Apache Airflow e acesso e modelagem dos dados através do DBeaver conectado diretamente ao ambiente cloud.

O projeto demonstra a capacidade de provisionar e operar uma arquitetura moderna de dados na nuvem, desde a ingestão até a camada analítica, com controle de execução, logs e reprocessamento via DAGs personalizadas.


🚀 Clique aqui para acessar o dashboard

Dashboard disponível em aws.henrique.vip — Airflow 3.x rodando em produção na nuvem.


Tecnologias: AWS · Apache Airflow 3.x · DBeaver · SQL · Cloud Data Warehouse

Pipeline AWS

Airflow Pessoal AWS

Data Warehouse na AWS — Banco de dados relacional provisionado no Amazon RDS, acessado via DBeaver e modelado via Airflow e dbt.

DBeaver conectado à AWS


6. Portfólio BI — Nubank

Dashboard de RH desenvolvido no Power BI com identidade visual inspirada no universo Nubank, explorando métricas e indicadores de gestão de pessoas.

O painel demonstra habilidades em modelagem dimensional, DAX, design de relatórios e storytelling com dados, com foco em clareza visual e profundidade analítica.

Tecnologias: Power BI · DAX · Modelagem Dimensional · Visualização de Dados


🚀 Clique aqui para acessar o painel interativo publicado

Painel publicado no Power BI Service — sem necessidade de login para visualização.


BI Nubank — Visão 1

BI Nubank — Visão 2


↑↑↓↓←→←→ B A

🚚 BEEP BEEP! Caminhão encontrado!

parabéns 👏

Caminhão Not Found

[ clique em qualquer lugar para dispensar o caminhão ]