ポートフォリオ - 機械学習 – データサイエンスポートフォリオ

プロジェクト

課題：メールキャンペーンのコンバージョンへの実際の影響は？

ベイズ分析とCausal MLを組み合わせた完全なA/Bテストプラットフォームで、単純な相関を超えてマーケティング介入の因果的影響を測定。

アプローチ：

結果：64,000人のEコマース顧客で、「Mens」メールで+16%のリフト、「Womens」で+8%を特定。

テクノロジー：Python、PyMC、CausalML、SHAP、FastAPI、Streamlit

課題：コンテキストと需要に基づいてリアルタイムで価格を最適化するには？

UberとLyftが使用するサージプライシング戦略を探索するプロジェクトで、計量経済学から強化学習への方法論的進行。

段階的アプローチ：

データセット：約70万件のUber＆Lyft乗車（ボストン、2018年11月）

テクノロジー：Python、PyMC、ArviZ、scikit-learn、Streamlit

課題：モダンなアーキテクチャでMLモデルをエンドツーエンドでデプロイするには？

トレーニングからデプロイまで、APIとフロントエンドを通じて、RとPythonの統合を含む完全なMLアーキテクチャのデモプロジェクト。

アーキテクチャ：

DuckDB → scikit-learn → Vetiver → FastAPI → Shiny (Python & R)

ハイライト：

テクノロジー：Python、R、scikit-learn、Vetiver、FastAPI、Shiny、Docker、GitHub Actions

課題：特性からアイオワ州の住宅販売価格を予測する。

ハーバードデータサイエンス修了証の最終プロジェクトで、多くの回帰アプローチを探索し比較。

テストされたモデル：

結果：体系的なパフォーマンス比較と最も重要な特徴量の特定。

テクノロジー：R、RMarkdown、caret、xgboost、randomForest