它是如何工作的?
我们做出的主要简化是将梯度提升称为神经网络。由于社会上对神经网络有明确的熟悉度,我们决定在解释什么是提升时不要过于 pedantic,因为没人在意。
所以,我们使用了亲爱的 Yandex Catboost。因为它运行速度快且易于学习。
它的工作原理如下:首先,我们构建一个简单的模型,能够做出一些预测。然后,我们查看这个模型的错误之处,并添加另一个纠正第一个模型错误的模型。然后,我们查看新模型的错误,并构建另一个模型来纠正这些错误。
我们持续进行这个过程,直到我们的模型足够准确。梯度提升的主要思想是我们添加的每个新模型都会考虑先前模型的错误,并提高模型的整体准确性。在我们的模型中,我们进行了 2000 个这样的阶段。
一旦所有模型都构建完成,我们将它们合并在一起,得到最终的模型,该模型可以根据我们提供的数据进行准确的预测。
所以,我们使用了亲爱的 Yandex Catboost。因为它运行速度快且易于学习。
入门
梯度提升是一种机器学习方法,允许你构建一个能够基于大量不同特征进行准确预测的预测模型。它的工作原理如下:首先,我们构建一个简单的模型,能够做出一些预测。然后,我们查看这个模型的错误之处,并添加另一个纠正第一个模型错误的模型。然后,我们查看新模型的错误,并构建另一个模型来纠正这些错误。
我们持续进行这个过程,直到我们的模型足够准确。梯度提升的主要思想是我们添加的每个新模型都会考虑先前模型的错误,并提高模型的整体准确性。在我们的模型中,我们进行了 2000 个这样的阶段。
一旦所有模型都构建完成,我们将它们合并在一起,得到最终的模型,该模型可以根据我们提供的数据进行准确的预测。
泰坦尼克号示例
有一张很好的插图,显示一个人在泰坦尼克号上是否会幸存。
在这里,三棵树以不同的顺序获取有关乘客的数据,然后整体投票决定一个人是否会幸存。
性别 - Gender
pclass - 票的等级。有 3 个级别。
年龄 - Age
sibsp - 是否有配偶在船上
parch - 船上的孩子数量
在训练模型后,您可以询问哪些变量影响了结果。
性别 - Gender
pclass - 票的等级。有 3 个级别。
年龄 - Age
sibsp - 是否有配偶在船上
parch - 船上的孩子数量
在训练模型后,您可以询问哪些变量影响了结果。