A/Bテストのための因果推論プラットフォーム

Causal Inference
Bayesian Statistics
A/B Testing
Python
ベイズ分析とCausal MLでマーケティングキャンペーンの実際の影響を測定

背景と課題

ビジネス課題:メールキャンペーンのコンバージョンへの実際の影響は?

従来のA/Bテストは「違いがあるか?」に答えます。しかし意思決定者はより微妙な答えを必要としています:

  • メールAがBより良い確率は?
  • 介入が最も効果的な顧客セグメントは?
  • 単なる相関ではなく、介入の因果効果は?

このプロジェクトでは、これらの質問に答える完全な因果推論プラットフォームを実装します。

データセット

Hillstrom Email Marketingデータセット(マーケティング分析の定番):

  • 64,000人のEコマース顧客
  • 3グループ:Mens E-Mail、Womens E-Mail、No E-Mail(コントロール)
  • メトリクス:訪問(はい/いいえ)、コンバージョン(はい/いいえ)、支出額

アプローチと方法論

1. ベイズA/Bテスト分析

単純な有意性検定(p値)ではなく、ベイズアプローチは以下を提供:

  • リフトの95%信用区間
  • 処置が優れている確率(P(Best))
  • 効果の完全な分布

2. Causal ML - 異質性効果(CATE)

平均効果はセグメント間の重要な変動を隠すことが多い。条件付き平均処置効果(CATE)は、介入に最もよく反応する人を特定します。

解釈のためにSHAPを使用したX-Learnerを使用。

3. 推薦API

顧客特徴に基づいてリアルタイム推薦を提供するFastAPI。

主要な結果

ベイズ分析

グループ コンバージョン率 コントロール比リフト P(Best)
コントロール 約5.0% - 0.00
Mens E-Mail 約5.8% +16% 0.92
Womens E-Mail 約5.4% +8% 0.78

異質性効果

「Mens」メールから最も恩恵を受ける顧客:

  • 購入履歴が多い(履歴 > $200)
  • 最近の購入者(recency < 6ヶ月)
  • すでに「mens」顧客(このカテゴリでの過去の購入)

ビジネス推奨

  1. 履歴が多い顧客をメールで優先的にターゲット
  2. 購入履歴に基づいてMens vs Womensをパーソナライズ
  3. 新規顧客へのメール送信を避ける(効果がほぼない)

デモ

Streamlitダッシュボードを見る

テクノロジー

コンポーネント テクノロジー
ベイズモデリング PyMC、ArviZ
Causal ML CausalML (X-Learner)
解釈可能性 SHAP
API FastAPI、Pydantic、Uvicorn
ダッシュボード Streamlit

学び

  1. ベイズ推論:点ではなく分布で考える
  2. 因果推論:相関と因果の違い
  3. Causal ML:X-Learnerで異質性効果を推定
  4. デプロイ:API経由でMLモデルを提供

← ポートフォリオMLに戻る | ダッシュボードを見る