Du modèle statistique classique au reinforcement learning, des projets qui créent de la valeur business.
Problématique : Quel est l’impact réel de nos campagnes email sur les conversions ?
Plateforme complète d’A/B testing combinant analyse Bayésienne et Causal ML pour aller au-delà de la simple corrélation et mesurer l’impact causal des interventions marketing.
Approche :
Résultats : Sur 64,000 clients e-commerce, identification d’un lift de +16% pour les emails “Mens” vs +8% pour “Womens”.
Technologies : Python, PyMC, CausalML, SHAP, FastAPI, Streamlit
Problématique : Comment optimiser les prix en temps réel selon le contexte et la demande ?
Projet explorant les stratégies de surge pricing utilisées par Uber et Lyft, avec une progression méthodologique de l’économétrie au reinforcement learning.
Approche progressive :
Dataset : ~700K trajets Uber & Lyft (Boston, Nov 2018)
Technologies : Python, PyMC, ArviZ, scikit-learn, Streamlit
Problématique : Comment déployer un modèle ML de bout en bout avec une architecture moderne ?
Projet démonstratif d’une architecture ML complète : de l’entraînement au déploiement, en passant par l’API et le frontend, avec intégration R et Python.
Architecture :
DuckDB → scikit-learn → Vetiver → FastAPI → Shiny (Python & R)
Points forts :
Technologies : Python, R, scikit-learn, Vetiver, FastAPI, Shiny, Docker, GitHub Actions
Problématique : Prédire le prix de vente de maisons en Iowa à partir de leurs caractéristiques.
Projet final du certificat Data Science de Harvard, explorant et comparant de nombreuses approches de régression.
Modèles testés :
Résultats : Comparaison systématique des performances et identification des features les plus importantes.
Technologies : R, RMarkdown, caret, xgboost, randomForest