Skip to content
View bssju's full-sized avatar

Block or report bssju

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
bssju/README.md

Habilidades

Linguagens e Ferramentas
Python · SQL · Power BI · Git · Docker

Bibliotecas e Frameworks
Scikit-learn · LightGBM · Pandas · NumPy · FastAPI · MLflow · SHAP · DoWhy · EconML · Optuna · pymoo · Keras · NLTK · Gensim · Evidently · Statsmodels · Pydantic · SciPy · PuLP · Matplotlib · Seaborn

Métodos
Classificação · Regressão · Engenharia de Features · Métodos Ensemble · Otimização Bayesiana · Análise Exploratória de Dados · Teste A/B · Power Analysis · Análise Bayesiana · Análise de Lift · Validação Temporal · Concept Drift · ML em Produção · Rastreamento de Experimentos · Monitoramento de Deriva de Dados · Inferência Causal · Modelagem de DAG Causal · Propensity Score Matching · Double Machine Learning · Efeitos Heterogêneos de Tratamento · Modelagem de Atribuição · Valores de Shapley · Otimização de Budget · Programação Linear Inteira · NLP · Otimização Multiobjetivo · Análise de Pareto · Visualização de Dados · ETL · DAX / Power Query


Projetos

Causalidade e Decisão

Projeto Descrição Ferramentas
Qual Canal Realmente Converte? Modelagem de Atribuição e Otimização de Budget de Mídia Comparação de quatro modelos de atribuição em canais de mídia paga. O Last-Click supervalorizou o Google Search e ignorou o Display. Com atribuição correta e otimização de alocação, o retorno esperado aumenta 14,3% sem investimento adicional. Python, SciPy, PuLP, Scikit-learn, Valores de Shapley
Hora Extra Aumenta a Rotatividade? Análise de Inferência Causal Análise para determinar se a hora extra causa diretamente a rotatividade de funcionários ou se outros fatores, como nível do cargo e salário, explicam a relação. Com três métodos independentes de estimação causal, o efeito direto da hora extra sobre a rotatividade foi de +21,1%, confirmado em testes de robustez. Python, DoWhy, EconML
A Nova Página Converte Mais? Teste A/B com Abordagem Clássica e Bayesiana Análise completa de experimento A/B em e-commerce (294.478 sessões, 21 dias). Power analysis retrospectivo confirmou poder acima de 99%, portanto a ausência de efeito é conclusiva. Quatro verificações de sanidade (incluindo SRM e KS-test horário), Z-test bilateral (p = 0,19) e análise bayesiana (P(tratamento > controle) de 44%) convergem para a mesma decisão: manter a página atual. Python, SciPy, Statsmodels, Pandas, NumPy

Modelagem Preditiva e Produção

Projeto Descrição Ferramentas
Quem Vai Assinar? Propensão de Clientes em Campanhas Bancárias Modelo de propensão para priorizar contatos em campanha telefônica bancária. O LightGBM captura 44,9% de todas as adesões ligando para apenas 10% da base (lift 4,5x). Inclui tratamento de vazamento de dados, validação temporal com detecção de concept drift e interpretação com SHAP. AUC-ROC: 0,808. Python, LightGBM, Scikit-learn, SHAP, MLflow, Pandas
   API de Propensão: Modelo Bancário em Produção Coloca em produção o modelo de propensão do projeto anterior. Inferência em lote e API REST com validação de domínio (Pydantic), autenticação, logging de previsões para monitoramento de drift e carregamento via MLflow Model Registry. Python, FastAPI, Pydantic, LightGBM, MLflow, Docker
Previsão de Preços de Imóveis: Do Modelo Base à Produção Série em três etapas: modelo base com 236 features (RMSLE 0,12949), otimização com Optuna e seleção multiobjetivo com redução de 65% das features e melhoria de 3,96%, e deploy com API REST, versionamento e monitoramento de drift em Docker (RMSLE 0,12436). Python, LightGBM, FastAPI, MLflow, Docker, Evidently, Optuna, pymoo
Identificação de Tweets sobre Desastres: Classificação com NLP Modelo para classificar automaticamente se um tweet relata um desastre real ou não. Limpeza de texto, extração de features linguísticas e combinação de três algoritmos ensemble. F1-Score: 0,80 no Kaggle. Python, NLTK, Gensim, Word2Vec, Scikit-learn
Reconhecimento de Dígitos Manuscritos: Rede Neural com 98% de Acurácia Rede neural treinada para identificar dígitos manuscritos (0 a 9) a partir de imagens. Inclui aumento de dados e regularização para evitar overfitting. Acurácia: 98% no Kaggle. Python, Keras, TensorFlow

Análise e Visualização

Projeto Descrição Ferramentas
Dashboard de Vendas: Análise de 8.800 Oportunidades no Power BI Dashboard interativo construído a partir de dados reais de CRM com 8.800 oportunidades de vendas. Modelagem de 4 tabelas, criação de métricas e visualizações de receita, taxa de conversão (63%) e desempenho por vendedor, produto e região. Power BI, DAX, Power Query

Formação

Grau Instituição Período
MBA em Ciência de Dados, Inteligência Artificial e Analytics USP/Esalq 2026 – 2027 (em andamento)
Especialização em Ciência de Dados Unicamp 2026 – 2027 (em andamento)
Pós-Doutorado em Química Analítica USP / IFSC 2022 – 2023
Doutorado em Ciências USP / IQSC 2018 – 2022
Bacharelado em Química USP / IQSC 2013 – 2017

Certificações

  • Certificado Profissional em Análise de Dados do Google (2026)
  • CDPO 3ª ed. Estatística e Otimização para Ciência de Dados e Pesquisa Operacional, ICMC/USP
  • Engenharia de Prompt para Engenheiros de Software, MBA USP/Esalq
  • Introdução ao Machine Learning com Python, MBA USP/Esalq
  • Python: Do Básico ao Avançado com Estudos de Caso, ICMC/USP
  • 9ª Escola Avançada de Big Data Analysis, ICMC/USP
  • Séries Temporais, Engenharia de Features, Deep Learning, Machine Learning, Pandas, Python, Kaggle

Contato

LinkedIn · buratojuliana@gmail.com

Popular repositories Loading

  1. 1-construcao-do-modelo-base-regressao 1-construcao-do-modelo-base-regressao Public

    Modelo para prever o preço de venda de casas com base em 236 características do imóvel. Incluiu limpeza de dados, criação de novas variáveis (área total, idade da casa, histórico de reformas) e aju…

    Jupyter Notebook

  2. reconhecimento-de-digitos-manuscritos reconhecimento-de-digitos-manuscritos Public

    Rede neural treinada para identificar dígitos escritos à mão (0 a 9) a partir de imagens. Incluiu aumento de dados para melhorar a generalização e técnicas de regularização para evitar overfitting.…

    Jupyter Notebook

  3. dashboard-de-vendas dashboard-de-vendas Public

    Dashboard interativo construído a partir de dados reais de CRM com 8.800 oportunidades de venda. Modelagem de 4 tabelas, criação de métricas e visualizações de receita, taxa de conversão (63%) e pe…

  4. identificacao-de-tweets-sobre-desastres-reais identificacao-de-tweets-sobre-desastres-reais Public

    Modelo para classificar automaticamente se um tweet trata de um desastre real ou não. Incluiu limpeza de texto, extração de características linguísticas e combinação de três algoritmos em conjunto.…

    Jupyter Notebook

  5. bssju bssju Public

  6. 2-extensao-do-modelo 2-extensao-do-modelo Public

    Extensão do modelo base com busca inteligente de hiperparâmetros (80 tentativas) e seleção automática das variáveis mais relevantes com algoritmo multiobjetivo. Reduziu 65% das variáveis com perda …

    Jupyter Notebook