यह कैसे काम करता है?
हमने जो मुख्य सरलीकरण किया है, उसमें ग्रेडिएंट बूस्टिंग को न्यूरल नेटवर्क के रूप में पुनः नामकरण किया है। क्योंकि समाज में न्यूरल नेटवर्क के प्रति स्पष्ट परिचय है, हमने बूस्टिंग क्या है यह व्याख्या करने में बहुत परेशान नहीं किया, क्योंकि किसी को परवाह नहीं है।
इसलिए, हमने यांडेक्स के पसंदीदा Catboost का उपयोग किया है। क्योंकि यह तेजी से काम करता है और सीखने में आसान है।
यह इस प्रकार काम करता है: पहले, हम एक सरल मॉडल बनाते हैं, जो कुछ पूर्वानुमान बना सकता है। फिर हम देखते हैं कि यह मॉडल कहां गलतियां करता है, और पहले मॉडल की गलतियों को सही करने वाला एक और मॉडल जोड़ते हैं। इसके बाद, हम नए मॉडल की गलतियों को देखते हैं और फिर एक और मॉडल बनाते हैं जो इन गलतियों को सही करता है।
हम इस प्रक्रिया को तब तक जारी रखते हैं जब तक हमारा मॉडल पर्याप्त रूप से सटीक नहीं हो जाता। ग्रेडिएंट बूस्टिंग की मुख्य विचारणा यह है कि हमारे द्वारा जो नए मॉडल जोड़ा जाता है, वह पिछले मॉडलों की गलतियों का ध्यान रखता है और मॉडल की कुल सटीकता को सुधारता है। हमारे मॉडल में, हमने 2000 ऐसे स्टेप किए हैं।
जब सभी मॉडल बन गए होते हैं, हम उन्हें मिलाकर हमें दी गई डेटा के आधार पर सटीक पूर्वानुमान बना सकते हैं, जो हमें प्रदान करते हैं।
इसलिए, हमने यांडेक्स के पसंदीदा Catboost का उपयोग किया है। क्योंकि यह तेजी से काम करता है और सीखने में आसान है।
आरंभ करना
ग्रेडिएंट बूस्टिंग एक मशीन लर्निंग की विधि है जो आपको बहुत सारी विभिन्न विशेषताओं के आधार पर सटीक पूर्वानुमान बनाने की क्षमता देती है।यह इस प्रकार काम करता है: पहले, हम एक सरल मॉडल बनाते हैं, जो कुछ पूर्वानुमान बना सकता है। फिर हम देखते हैं कि यह मॉडल कहां गलतियां करता है, और पहले मॉडल की गलतियों को सही करने वाला एक और मॉडल जोड़ते हैं। इसके बाद, हम नए मॉडल की गलतियों को देखते हैं और फिर एक और मॉडल बनाते हैं जो इन गलतियों को सही करता है।
हम इस प्रक्रिया को तब तक जारी रखते हैं जब तक हमारा मॉडल पर्याप्त रूप से सटीक नहीं हो जाता। ग्रेडिएंट बूस्टिंग की मुख्य विचारणा यह है कि हमारे द्वारा जो नए मॉडल जोड़ा जाता है, वह पिछले मॉडलों की गलतियों का ध्यान रखता है और मॉडल की कुल सटीकता को सुधारता है। हमारे मॉडल में, हमने 2000 ऐसे स्टेप किए हैं।
जब सभी मॉडल बन गए होते हैं, हम उन्हें मिलाकर हमें दी गई डेटा के आधार पर सटीक पूर्वानुमान बना सकते हैं, जो हमें प्रदान करते हैं।
टाइटैनिक का उदाहरण
वहां एक खूबसूरत चित्र है जिससे पता चलता है कि क्या कोई व्यक्ति टाइटैनिक पर बचेगा या नहीं।
यहाँ, तीन पेड़ यात्री के डेटा को विभिन्न क्रम में लेते हैं और फिर संगठन समूह वोट करता है कि व्यक्ति क्या टाइटैनिक पर बचेगा या नहीं।
लिंग - Gender
प्रकार - टिकट का प्रकार। 3 स्तर थे।
आयु - Age
सहभागी - क्या बोर्ड पर पतियों के साथी थे
पार्च - बोर्ड पर बच्चों की संख्या
मॉडल की प्रशिक्षण के बाद, आप पूछ सकते हैं कि परिणाम को किस चरण प्रभावित करते हैं।
लिंग - Gender
प्रकार - टिकट का प्रकार। 3 स्तर थे।
आयु - Age
सहभागी - क्या बोर्ड पर पतियों के साथी थे
पार्च - बोर्ड पर बच्चों की संख्या
मॉडल की प्रशिक्षण के बाद, आप पूछ सकते हैं कि परिणाम को किस चरण प्रभावित करते हैं।