Como isso funciona?
A principal simplificação que fizemos é chamar o Gradient Boosting de rede neural. Uma vez que há uma clara familiaridade com redes neurais na sociedade, decidimos não ser detalhistas ao explicar o que é o boosting, pois ninguém se importa.
Assim, usamos o querido Catboost da Yandex. Porque ele é rápido e fácil de aprender.
Aqui está como funciona: primeiro, construímos um modelo simples que pode fazer algumas previsões. Em seguida, observamos onde esse modelo comete erros e adicionamos outro modelo que corrige os erros do primeiro modelo. Depois disso, observamos os erros do novo modelo e construímos mais um modelo que corrige esses erros.
Continuamos esse processo até que nosso modelo seja suficientemente preciso. A ideia principal do Gradient Boosting é que cada novo modelo que adicionamos leva em consideração os erros dos modelos anteriores e melhora a precisão geral do modelo. Em nosso modelo, fizemos 2000 dessas etapas.
Quando todos os modelos são construídos, os combinamos para obter o modelo final, que pode fazer previsões precisas com base nos dados que fornecemos a ele.
Assim, usamos o querido Catboost da Yandex. Porque ele é rápido e fácil de aprender.
Começando
O Gradient Boosting é um método de aprendizado de máquina que permite construir um modelo preditivo capaz de fazer previsões precisas com base em várias características diferentes.Aqui está como funciona: primeiro, construímos um modelo simples que pode fazer algumas previsões. Em seguida, observamos onde esse modelo comete erros e adicionamos outro modelo que corrige os erros do primeiro modelo. Depois disso, observamos os erros do novo modelo e construímos mais um modelo que corrige esses erros.
Continuamos esse processo até que nosso modelo seja suficientemente preciso. A ideia principal do Gradient Boosting é que cada novo modelo que adicionamos leva em consideração os erros dos modelos anteriores e melhora a precisão geral do modelo. Em nosso modelo, fizemos 2000 dessas etapas.
Quando todos os modelos são construídos, os combinamos para obter o modelo final, que pode fazer previsões precisas com base nos dados que fornecemos a ele.
Exemplo do Titanic
Há uma bela ilustração que mostra se uma pessoa sobreviverá ao Titanic.
Aqui, três árvores captam dados do passageiro em diferentes sequências e, em seguida, o conjunto vota para decidir se a pessoa sobreviverá ou não.
Sexo - Gênero
pclass - Classe do bilhete. Havia 3 níveis.
Idade - Age
sibsp - Havia cônjuges a bordo
parch - Número de filhos a bordo
Após o treinamento do modelo, você pode perguntar quais variáveis influenciam o resultado.
Sexo - Gênero
pclass - Classe do bilhete. Havia 3 níveis.
Idade - Age
sibsp - Havia cônjuges a bordo
parch - Número de filhos a bordo
Após o treinamento do modelo, você pode perguntar quais variáveis influenciam o resultado.