Linguagens e Ferramentas
Python · SQL · Power BI · Git · Docker
Bibliotecas e Frameworks
Scikit-learn · LightGBM · Pandas · NumPy · FastAPI · MLflow · SHAP · DoWhy · EconML · Optuna · pymoo · Keras · NLTK · Gensim · Evidently · Statsmodels · Pydantic · SciPy · PuLP · Matplotlib · Seaborn
Métodos
Classificação · Regressão · Engenharia de Features · Métodos Ensemble · Otimização Bayesiana · Análise Exploratória de Dados · Teste A/B · Power Analysis · Análise Bayesiana · Análise de Lift · Validação Temporal · Concept Drift · ML em Produção · Rastreamento de Experimentos · Monitoramento de Deriva de Dados · Inferência Causal · Modelagem de DAG Causal · Propensity Score Matching · Double Machine Learning · Efeitos Heterogêneos de Tratamento · Modelagem de Atribuição · Valores de Shapley · Otimização de Budget · Programação Linear Inteira · NLP · Otimização Multiobjetivo · Análise de Pareto · Visualização de Dados · ETL · DAX / Power Query
| Projeto | Descrição | Ferramentas |
|---|---|---|
| Qual Canal Realmente Converte? Modelagem de Atribuição e Otimização de Budget de Mídia | Comparação de quatro modelos de atribuição em canais de mídia paga. O Last-Click supervalorizou o Google Search e ignorou o Display. Com atribuição correta e otimização de alocação, o retorno esperado aumenta 14,3% sem investimento adicional. | Python, SciPy, PuLP, Scikit-learn, Valores de Shapley |
| Hora Extra Aumenta a Rotatividade? Análise de Inferência Causal | Análise para determinar se a hora extra causa diretamente a rotatividade de funcionários ou se outros fatores, como nível do cargo e salário, explicam a relação. Com três métodos independentes de estimação causal, o efeito direto da hora extra sobre a rotatividade foi de +21,1%, confirmado em testes de robustez. | Python, DoWhy, EconML |
| A Nova Página Converte Mais? Teste A/B com Abordagem Clássica e Bayesiana | Análise completa de experimento A/B em e-commerce (294.478 sessões, 21 dias). Power analysis retrospectivo confirmou poder acima de 99%, portanto a ausência de efeito é conclusiva. Quatro verificações de sanidade (incluindo SRM e KS-test horário), Z-test bilateral (p = 0,19) e análise bayesiana (P(tratamento > controle) de 44%) convergem para a mesma decisão: manter a página atual. | Python, SciPy, Statsmodels, Pandas, NumPy |
| Projeto | Descrição | Ferramentas |
|---|---|---|
| Quem Vai Assinar? Propensão de Clientes em Campanhas Bancárias | Modelo de propensão para priorizar contatos em campanha telefônica bancária. O LightGBM captura 44,9% de todas as adesões ligando para apenas 10% da base (lift 4,5x). Inclui tratamento de vazamento de dados, validação temporal com detecção de concept drift e interpretação com SHAP. AUC-ROC: 0,808. | Python, LightGBM, Scikit-learn, SHAP, MLflow, Pandas |
| API de Propensão: Modelo Bancário em Produção | Coloca em produção o modelo de propensão do projeto anterior. Inferência em lote e API REST com validação de domínio (Pydantic), autenticação, logging de previsões para monitoramento de drift e carregamento via MLflow Model Registry. | Python, FastAPI, Pydantic, LightGBM, MLflow, Docker |
| Previsão de Preços de Imóveis: Do Modelo Base à Produção | Série em três etapas: modelo base com 236 features (RMSLE 0,12949), otimização com Optuna e seleção multiobjetivo com redução de 65% das features e melhoria de 3,96%, e deploy com API REST, versionamento e monitoramento de drift em Docker (RMSLE 0,12436). | Python, LightGBM, FastAPI, MLflow, Docker, Evidently, Optuna, pymoo |
| Identificação de Tweets sobre Desastres: Classificação com NLP | Modelo para classificar automaticamente se um tweet relata um desastre real ou não. Limpeza de texto, extração de features linguísticas e combinação de três algoritmos ensemble. F1-Score: 0,80 no Kaggle. | Python, NLTK, Gensim, Word2Vec, Scikit-learn |
| Reconhecimento de Dígitos Manuscritos: Rede Neural com 98% de Acurácia | Rede neural treinada para identificar dígitos manuscritos (0 a 9) a partir de imagens. Inclui aumento de dados e regularização para evitar overfitting. Acurácia: 98% no Kaggle. | Python, Keras, TensorFlow |
| Projeto | Descrição | Ferramentas |
|---|---|---|
| Dashboard de Vendas: Análise de 8.800 Oportunidades no Power BI | Dashboard interativo construído a partir de dados reais de CRM com 8.800 oportunidades de vendas. Modelagem de 4 tabelas, criação de métricas e visualizações de receita, taxa de conversão (63%) e desempenho por vendedor, produto e região. | Power BI, DAX, Power Query |
| Grau | Instituição | Período |
|---|---|---|
| MBA em Ciência de Dados, Inteligência Artificial e Analytics | USP/Esalq | 2026 – 2027 (em andamento) |
| Especialização em Ciência de Dados | Unicamp | 2026 – 2027 (em andamento) |
| Pós-Doutorado em Química Analítica | USP / IFSC | 2022 – 2023 |
| Doutorado em Ciências | USP / IQSC | 2018 – 2022 |
| Bacharelado em Química | USP / IQSC | 2013 – 2017 |
- Certificado Profissional em Análise de Dados do Google (2026)
- CDPO 3ª ed. Estatística e Otimização para Ciência de Dados e Pesquisa Operacional, ICMC/USP
- Engenharia de Prompt para Engenheiros de Software, MBA USP/Esalq
- Introdução ao Machine Learning com Python, MBA USP/Esalq
- Python: Do Básico ao Avançado com Estudos de Caso, ICMC/USP
- 9ª Escola Avançada de Big Data Analysis, ICMC/USP
- Séries Temporais, Engenharia de Features, Deep Learning, Machine Learning, Pandas, Python, Kaggle