
モデル選択:推定器とそのパラメータの選択
機械学習において、モデル選択は、与えられたデータセットに対して最適なモデルを選ぶプロセスです。適切な推定器を選択し、そのパラメータを調整して最適な性能を達成することが含まれます。このチュートリアルでは、scikit-learn におけるモデル選択のプロセスを案内します。
Machine Learningscikit-learn

Scikit - Learn を使った教師あり学習
教師あり学習では、2 つのデータセット間の関係を学びたいものです。1 つは観測データ X で、もう 1 つは予測したい外部変数 y です。
Machine Learningscikit-learn

判別分析分類器の解説
線形判別分析 (Linear and Quadratic Discriminant Analysis, LDA) と二次判別分析 (QDA) は、機械学習で使用される 2 つの古典的な分類器です。LDA は線形の決定面を使用し、QDA は二次の決定面を使用します。これらの分類器は、閉形式の解を持ち、実際に良好に機能し、調整するハイパーパラメータがないため、人気があります。
Machine Learningscikit-learn

Scikit - Learn における線形モデル
この実験では、Scikit - Learn における線形モデルを調べます。線形モデルは、回帰と分類タスクに使用される一連の手法です。これらは、目的変数が特徴の線形結合であると仮定しています。これらのモデルは、その単純さと解釈可能性のため、機械学習で広く使用されています。
Machine Learningscikit-learn

カーネルリッジ回帰
この実験では、カーネルリッジ回帰(KRR)と Python の scikit - learn ライブラリを使ったその実装方法について学びます。KRR は、リッジ回帰とカーネルトリックを組み合わせて、カーネルによって誘導される空間で線形関数を学習します。入力と出力変数間の非線形関係を処理できる非線形回帰手法です。
Machine Learningscikit-learn

Scikit - Learn のデータセットと推定器を探る
この実験では、Python の人気のある機械学習ライブラリである Scikit - Learn における設定と推定器オブジェクトを探ります。2 次元配列として表されるデータセットについて学び、Scikit - Learn 用にそれらを前処理する方法を学びます。また、データから学習し予測を行うために使用される推定器オブジェクトの概念も探ります。
Machine Learningscikit-learn

予測対象の変換
機械学習においては、モデルを学習する前に予測対象を変換する必要がよくあります。これには、多クラスラベルを 2 値インジケータ行列に変換する、または非数値ラベルを数値ラベルにエンコードするなどのタスクが含まれます。
Machine Learningscikit-learn

Scikit-Learn におけるペアワイズメトリックとカーネル
この実験では、scikit-learn の sklearn.metrics.pairwise サブモジュールを調べます。このモジュールは、サンプルセット間のペアワイズ距離と親和性を計算するためのユーティリティを提供します。
Machine Learningscikit-learn

Scikit - Learn における前処理技術
この実験では、scikit - Learn に利用可能な前処理技術を探ります。前処理は、学習アルゴリズムに適した形式に生データを変換するのに役立つため、機械学習のワークフローにおいて不可欠なステップです。標準化、スケーリング、正規化、カテゴリカル特徴のエンコーディング、欠損値の補完、多項式特徴の生成、およびカスタムトランスフォーマーの作成など、様々な前処理技術を扱います。
Machine Learningscikit-learn

Scikit - learn におけるカーネル近似手法
このチュートリアルでは、Scikit - learn でカーネル近似手法を使用するプロセスを案内します。
Machine Learningscikit-learn

欠損値の補完
多くの現実世界のデータセットには欠損値が含まれており、完全な数値データを前提とする機械学習アルゴリズムを使用する際に問題を引き起こす可能性があります。そのような場合、利用可能なデータを最大限活用するために欠損値を適切に処理することが重要です。一般的な戦略の 1 つは補完であり、これはデータの既知の部分に基づいて欠損値を埋めることを意味します。
Machine Learningscikit-learn

パーミュテーション特徴量重要度
この実験では、予測モデルにおける特徴量の重要度を決定するために使用されるモデル検査技術であるパーミュテーション特徴量重要度法について学びます。この技術は、解釈が難しい非線形または不透明なモデルに対して特に役立つ場合があります。
Machine Learningscikit-learn

Scikit - Learn を使った特徴抽出
この実験では、scikit - learn ライブラリを使って特徴抽出を行う方法を学びます。特徴抽出は、生データを機械学習アルゴリズムが使用できる数値特徴に変換するプロセスです。これには、テキストや画像など、さまざまな種類のデータから関連情報を抽出することが含まれます。
Machine Learningscikit-learn

推定器のハイパーパラメータのチューニング
ハイパーパラメータは、推定器によって直接学習されないパラメータです。これらは、推定器クラスのコンストラクタに引数として渡されます。推定器のハイパーパラメータを調整することは、効果的な機械学習モデルを構築する際の重要なステップです。これには、モデルの最良の性能をもたらすハイパーパラメータの最適な組み合わせを見つけることが含まれます。
Machine Learningscikit-learn

パイプラインと複合推定器
scikit-learn では、パイプラインと複合推定器を使用して、複数のトランスフォーマーと推定器を単一のモデルに結合します。これは、データ処理に固定された一連のステップ(特徴選択、正規化、分類など)がある場合に便利です。パイプラインは、共通のパラメータ選択にも使用でき、クロスバリデーション中にテストデータの統計情報が学習済みモデルに漏れないようにするためにも使用できます。
Machine Learningscikit-learn

機械学習モデルの品質評価
機械学習においては、モデルによる予測の品質を評価することが重要です。これにより、モデルがどの程度機能しているか、正確な予測を行うために信頼できるかを理解することができます。scikit - learn ライブラリは、予測の品質を定量化するためのいくつかのメトリックと評価方法を提供しています。
Machine Learningscikit-learn

部分依存性と個別条件期待値
部分依存性プロット(PDP)と個別条件期待値(ICE)プロットは、目的変数と一連の入力特徴量の間の相互作用を可視化し分析するための便利なツールです。PDP は目的変数と入力特徴量の間の依存性を示し、ICE プロットは各個々のサンプルに対する予測の特徴量に対する依存性を可視化します。これらのプロットは、目的変数と入力特徴量の関係を理解するのに役立ちます。
Machine Learningscikit-learn

検証曲線:モデルを評価するためのスコアのプロット
機械学習において、各推定器にはその利点と欠点があります。推定器の汎化誤差は、バイアス、分散、ノイズに分解できます。推定器のバイアスは、異なる学習セットに対する平均誤差であり、分散は学習セットの変化に対する感度を示します。ノイズはデータの特性です。
Machine Learningscikit-learn