kaggleを戦う基礎知識
随時追記。
Cross Validation
やり方の一例
sklearnのStraitifiedKFoldを使う方法
from sklearn.model_selection import StratifiedKFold cv = StratifiedKFold(n_splits=3, shuffle=True, random_seed=seed) for train_idx, target_idx in cv.split(train_x, target): ....
EDA
基礎集計。kaggleでデータの性質を見るようなkernelのタイトルについていることが多い。
どんな分析をしているか、どんなデータであるかを確認することを目的として読んだら良い。