住宅価格予測 - ハーバード修了証

Regression

Ensemble Learning

Harvard

ハーバードデータサイエンス修了証の最終プロジェクト - 回帰モデルの比較

背景と課題

課題：特性からアイオワ州の住宅販売価格を予測する。

このプロジェクトはハーバードデータサイエンス修了証（HarvardX）の最終評価です。多くの回帰アプローチを比較できる定番のKaggleチャレンジです。

Ames Housingデータセット：

カテゴリ	変数
面積	GrLivArea、TotalBsmtSF、GarageArea
品質	OverallQual、OverallCond、ExterQual
場所	Neighborhood、MSZoning
築年数	YearBuilt、YearRemodAdd
設備	FullBath、BedroomAbvGr、Fireplaces

モデル	RMSE (CV)	R²	ランク
線形回帰	34,521	0.82	6
ランダムフォレスト	28,934	0.87	3
XGBoost	27,156	0.89	2
GAM	29,845	0.86	4
ニューラルネットワーク	31,234	0.84	5
アンサンブル	26,012	0.90	1

XGBoostとランダムフォレスト分析より：

コンポーネント	テクノロジー
言語	R
データラングリング	tidyverse (dplyr、tidyr)
MLフレームワーク	caret
モデル	lm、randomForest、xgboost、mgcv (GAM)、nnet
可視化	ggplot2
ドキュメント	RMarkdown

この修了証プロジェクトで以下が可能になりました：

このプロジェクトはHarvardXのProfessional Certificate in Data Scienceの一部で、以下をカバー：