コンテンツにスキップ

Trainerノード

TrainerノードはMLOps Desktopのモデル学習の中核です。3つのモード:新規モデルの学習、事前学習済みモデルの読み込み、Optunaでのハイパーパラメータチューニングをサポートします。

プロパティ
タイプ処理ノード
入力DataFrame(DataLoaderまたはDataSplitから)
出力学習済みモデル
ライブラリscikit-learn
モードTrain、Load、Tune

Trainerノードには3つのモードがあり、トグルボタンで選択:

新規モデルをゼロから学習。

設定:

  • Model Type — 12アルゴリズムから選択
  • Target Column — 予測するカラム
  • Test Split — 訓練/テスト分割の比率(DataSplitノードを使用しない場合)

初期のモデル開発や素早い実験に最適。

モデル説明主要ハイパーパラメータ
ロジスティック回帰線形分類器、解釈しやすいCmax_iter
Random Forest Classifier決定木のアンサンブルn_estimatorsmax_depthmin_samples_split
Gradient Boosting Classifier逐次ブースティング、高精度n_estimatorslearning_ratemax_depth
SVM (SVC)サポートベクターマシンCkernelgamma
KNN Classifier距離ベースの分類n_neighborsweightsmetric
MLP Classifierニューラルネットワークhidden_layer_sizesalphalearning_rate_init
モデル説明主要ハイパーパラメータ
線形回帰シンプルな線形モデルなし(チューニング不可)
Random Forest Regressor回帰用アンサンブルn_estimatorsmax_depthmin_samples_split
Gradient Boosting Regressor回帰用ブースト木n_estimatorslearning_ratemax_depth
SVM (SVR)サポートベクター回帰Ckernelgamma
KNN Regressor距離ベースの回帰n_neighborsweightsmetric
MLP Regressor回帰用ニューラルネットワークhidden_layer_sizesalphalearning_rate_init

ハイパーパラメータチューニング

Section titled “ハイパーパラメータチューニング”

Tuneモード選択時、チューニング設定ボタンをクリックしてTuningPanelを開きます。

戦略説明最適な用途
Bayesian (TPE)Tree-structured Parzen Estimator、過去のトライアルから学習ほとんどの場合(デフォルト)
Random一様ランダムサンプリングベースライン比較
Grid全組み合わせの網羅的列挙小さな離散空間
設定範囲デフォルト説明
Number of Trials1-100050試す設定の数
CV Folds2-103交差検証フォールド数
Scoring Metric様々accuracy/r2最適化するメトリクス

各モデルには事前定義の探索範囲があります:

Random Forest:

n_estimators: 50-300(ステップ50)
max_depth: [null, 10, 15, 20, 30]
min_samples_split: 2-10(ステップ2)
min_samples_leaf: 1-4(ステップ1)

Gradient Boosting:

n_estimators: 50-300(ステップ50)
learning_rate: 0.01-0.3(対数スケール)
max_depth: 3-8(ステップ1)
subsample: 0.7-1.0(一様)

SVM (SVC/SVR):

C: 0.1-100(対数スケール)
kernel: [rbf, linear, poly]
gamma: [scale, auto]

KNN:

n_neighbors: 3-21(ステップ2)
weights: [uniform, distance]
metric: [euclidean, manhattan, minkowski]

MLPニューラルネットワーク:

hidden_layer_sizes: [(50,), (100,), (100,50), (100,100)]
alpha: 0.0001-0.1(対数スケール)
learning_rate_init: 0.0001-0.1(対数スケール)
max_iter: 200-1000(ステップ100)

分類:

  • Accuracy
  • F1 Score
  • Precision
  • Recall
  • ROC AUC

回帰:

  • R² Score
  • Neg MSE
  • Neg MAE
  • Neg RMSE

Trainerは以下を自動的に処理:

  • 欠損値 — 数値カラムは中央値、カテゴリカルは最頻値で補完
  • カテゴリカルエンコーディング — 全カテゴリカルカラムにラベルエンコーディング
  • IDカラムのフィルタリングidindexnameticketcabinなどのカラムを削除
  • 高カーディナリティカラム — 50以上のユニーク値を持つカラムを削除
方向ノードタイプ
入力元DataLoader、DataSplit
出力先Evaluator、ModelExporter

典型的なパイプライン:

DataLoader → DataSplit → Trainer → Evaluator

チューニング時、結果はTrialsタブに表示:

カラム説明
Trial #トライアル番号
Score交差検証スコア
Parameters使用したハイパーパラメータ値
Duration所要時間
StatusComplete、Pruned、またはFailed

最良のトライアルはスターアイコンでハイライトされます。

「線形回帰はチューニングできません」

Section titled “「線形回帰はチューニングできません」”

線形回帰にはチューニング可能なハイパーパラメータがありません。Trainモードを使用するか、別のモデルを選択してください。

「Optunaがインストールされていません」

Section titled “「Optunaがインストールされていません」”

Optunaをインストール:

Terminal window
pip install optuna
  • トライアル数を減らす
  • GridではなくRandomサーチを使用
  • CVフォールドを減らす(最小2)
  • より高速なモデルを使用(MLPよりLogistic Regression)

「ターゲットカラムが見つかりません」

Section titled “「ターゲットカラムが見つかりません」”

カラム名が完全に一致しているか確認(大文字小文字を区別)。DataLoaderプレビューでカラム名を確認してください。