matthew as a q.

目標10記事quant

kaggleを戦う基礎知識

随時追記。

Cross Validation

やり方の一例

sklearnのStraitifiedKFoldを使う方法
from sklearn.model_selection import StratifiedKFold

cv = StratifiedKFold(n_splits=3, shuffle=True, random_seed=seed)

for train_idx, target_idx in cv.split(train_x, target):
    ....

EDA

基礎集計。kaggleでデータの性質を見るようなkernelのタイトルについていることが多い。
どんな分析をしているか、どんなデータであるかを確認することを目的として読んだら良い。

optional

tmuxの使い方

AWSGCPを借りて作業する場合、セッションを維持したまま別の作業をするために、tmuxは必須。

  • 前提

- 作業環境
Ubuntu 16.04 LST

  • インストール
sudo apt-get install tmux
  • 水平分割で別のpaneを開く
Ctrl b + "
  • 垂直分割で別のpaneを開く
Ctrl b + %
  • 別のpaneへ移動
Ctrl b + o

Pythonの使い方

Dictionaryをキーワード引数として渡す方法
  • test_funcへDictionaryのparams引数を渡す場合
test_func(**params)