どのように機能しますか?
私たちが行った主な単純化は、勾配ブースティングをニューラルネットワークと呼ぶことです。社会にはニューラルネットワークに対する明確な親しみがあるため、ブースティングとは何かを説明するのは無駄だと判断しました。
したがって、私たちはヤンデックスの愛されるCatboostを使用しました。なぜなら、それは高速に動作し学習が容易だからです。
これは次のように機能します。まず、いくつかの予測を行うことができる単純なモデルを構築します。次に、このモデルがどこで誤りを comitte しているかを確認し、最初のモデルの誤りを修正する別のモデルを追加します。その後、新しいモデルの誤りを見て、これらの誤りを修正する別のモデルを構築します。
私たちはモデルが十分に正確になるまでこのプロセスを続けます。勾配ブースティングの主なアイデアは、追加する各新しいモデルが前のモデルの誤りを考慮に入れ、モデル全体の正確性を向上させることです。私たちのモデルでは、このような段階を2000回経験しました。
すべてのモデルが構築されたら、それらを結合して、提供するデータに基づいて正確な予測ができる最終モデルを取得します。
したがって、私たちはヤンデックスの愛されるCatboostを使用しました。なぜなら、それは高速に動作し学習が容易だからです。
はじめに
勾配ブースティングは、多くの異なる特徴に基づいて正確な予測を行うことができる予測モデルを構築する機械学習の方法です。これは次のように機能します。まず、いくつかの予測を行うことができる単純なモデルを構築します。次に、このモデルがどこで誤りを comitte しているかを確認し、最初のモデルの誤りを修正する別のモデルを追加します。その後、新しいモデルの誤りを見て、これらの誤りを修正する別のモデルを構築します。
私たちはモデルが十分に正確になるまでこのプロセスを続けます。勾配ブースティングの主なアイデアは、追加する各新しいモデルが前のモデルの誤りを考慮に入れ、モデル全体の正確性を向上させることです。私たちのモデルでは、このような段階を2000回経験しました。
すべてのモデルが構築されたら、それらを結合して、提供するデータに基づいて正確な予測ができる最終モデルを取得します。
タイタニックの例
タイタニック号で人が生き残るかどうかを示す素敵なイラストがあります。
ここでは、3つのツリーが異なる順序で乗客のデータを取得し、その後アンサンブルがその人が生き残るかどうかに投票します。
性別 - Gender
pclass - チケットのクラス。3つのレベルがありました。
年齢 - Age
sibsp - 船上に配偶者がいたかどうか
parch - 船上の子供の数
モデルのトレーニング後、結果に影響を与える変数を尋ねることができます。
性別 - Gender
pclass - チケットのクラス。3つのレベルがありました。
年齢 - Age
sibsp - 船上に配偶者がいたかどうか
parch - 船上の子供の数
モデルのトレーニング後、結果に影響を与える変数を尋ねることができます。