पीछे की ओर प्रेरण

पिछड़े हुए प्रेरण क्या है?

गेम थ्योरी में बैकवर्ड इंडक्शन एक समस्या या स्थिति के अंत से समय में पिछड़े तर्क की एक पुनरावृत्ति प्रक्रिया है, जो परिमित व्यापक रूप और अनुक्रमिक गेम को हल करने के लिए, और इष्टतम कार्यों के अनुक्रम का अनुमान लगाती है।

बैकवर्ड इंडक्शन समझाया

जॉन वॉन न्यूमैन और ऑस्कर मोर्गनस्टर्न स्थापित गेम थ्योरी को अकादमिक विषय के रूप में स्थापित करने के बाद से बैकवर्ड इंडक्शन का इस्तेमाल किया गया, जब उन्होंने 1944 में अपनी पुस्तक, थ्योरी ऑफ़ गेम्स और इकोनॉमिक बिहेवियर को प्रकाशित किया ।

खेल के प्रत्येक चरण में पिछड़े प्रेरण खिलाड़ी की इष्टतम रणनीति को निर्धारित करता है जो खेल में अंतिम चाल बनाता है। फिर, अगले-से-अंतिम मूविंग प्लेयर की इष्टतम कार्रवाई निर्धारित की जाती है, अंतिम खिलाड़ी की कार्रवाई को देखते हुए। यह प्रक्रिया तब तक पिछड़ी रहती है जब तक कि हर बिंदु के लिए सबसे अच्छी कार्रवाई निर्धारित नहीं की गई है। प्रभावी रूप से, कोई मूल खेल के प्रत्येक उपगेम के नैश संतुलन का निर्धारण कर रहा है ।

हालांकि, पिछड़े प्रेरण से निकले परिणाम अक्सर वास्तविक मानव खेल की भविष्यवाणी करने में विफल होते हैं। प्रायोगिक अध्ययनों से पता चला है कि “तर्कसंगत” व्यवहार (जैसा कि खेल सिद्धांत द्वारा भविष्यवाणी की गई है) शायद ही कभी वास्तविक जीवन में प्रदर्शित होता है। तर्कहीन खिलाड़ी वास्तव में पिछड़े प्रेरण द्वारा भविष्यवाणी की तुलना में उच्च भुगतान प्राप्त कर सकते हैं, जैसा कि सेंटीपीड गेम में चित्रित किया गया है ।

सेंटीपीड गेम में, दो खिलाड़ियों को बारी-बारी से पैसे के बढ़ते बर्तन का बड़ा हिस्सा लेने का मौका मिलता है, या दूसरे खिलाड़ी को बर्तन पास करने का मौका मिलता है। अदायगी की व्यवस्था इसलिए की जाती है कि यदि किसी के प्रतिद्वंद्वी को पॉट पास किया जाता है और प्रतिद्वंद्वी अगले राउंड पर पॉट लेता है, तो व्यक्ति इस राउंड पर पॉट ले जाने की तुलना में थोड़ा कम प्राप्त करता है। जैसे ही एक खिलाड़ी स्लैश लेता है, उस खिलाड़ी का बड़ा हिस्सा हो जाता है और दूसरे खिलाड़ी का छोटा हिस्सा हो जाता है।

बैकवर्ड इंडक्शन का उदाहरण

एक उदाहरण के रूप में, मान लें कि प्लेयर ए पहले जाता है और यह तय करना होता है कि उसे “ले जाना” या “पास” करना चाहिए, जो वर्तमान में $ 2 तक है। यदि वह लेता है, तो ए और बी को $ 1 प्रत्येक मिलता है, लेकिन यदि ए पास होता है, तो अब लेने या पास करने का निर्णय प्लेयर बी द्वारा किया जाना है। यदि बी लेता है, तो उसे $ 3 मिलता है (यानी, $ 2 + $ 1 का पिछला स्लैश) और A को $ 0 मिलता है। लेकिन यदि बी पास हो जाता है, तो ए को अब यह तय करना होगा कि क्या लेना है या पास करना है, और इसी तरह। यदि दोनों खिलाड़ी हमेशा पास करना चुनते हैं, तो वे खेल के अंत में $ 100 का भुगतान प्राप्त करते हैं।

खेल की बात यह है कि यदि A और B दोनों सहयोग करते हैं और खेल के अंत तक पास करना जारी रखते हैं, तो उन्हें प्रत्येक $ 100 का अधिकतम भुगतान प्राप्त होता है। लेकिन अगर वे दूसरे खिलाड़ी का अविश्वास करते हैं और उनसे उम्मीद करते हैं कि पहले मौके पर “ले” करेंगे, तो नैश संतुलन की भविष्यवाणी करता है कि खिलाड़ी सबसे कम संभव दावा करेंगे (इस मामले में $ 1)।

इस खेल का नैश संतुलन, जहां किसी भी खिलाड़ी को प्रतिद्वंद्वी की पसंद पर विचार करने के बाद अपनी चुनी हुई रणनीति से विचलित करने का प्रोत्साहन नहीं होता है, पहले खिलाड़ी को खेल के पहले दौर में पॉट लेने का सुझाव देता है। हालांकि, वास्तव में, अपेक्षाकृत कम खिलाड़ी ऐसा करते हैं। नतीजतन, उन्हें संतुलन विश्लेषण द्वारा भविष्यवाणी की गई अदायगी की तुलना में अधिक भुगतान मिलता है।

पिछड़े प्रेरण का उपयोग करके अनुक्रमिक खेलों को हल करना

नीचे दो खिलाड़ियों के बीच एक सरल अनुक्रमिक खेल है। उनके भीतर प्लेयर 1 और प्लेयर 2 के साथ लेबल क्रमशः एक या दो खिलाड़ियों के लिए सूचना सेट हैं। पेड़ के नीचे कोष्ठक में संख्या प्रत्येक संबंधित बिंदु पर अदायगी है। खेल भी अनुक्रमिक है, इसलिए प्लेयर 1 पहला निर्णय (बाएं या दाएं) करता है और प्लेयर 2 प्लेयर 1 (ऊपर या नीचे) के बाद अपना निर्णय लेता है।

बैकवर्ड इंडक्शन, सभी खेल सिद्धांत की तरह, तर्कसंगतता और अधिकतमकरण की धारणाओं का उपयोग करता है, जिसका अर्थ है कि खिलाड़ी 2 किसी भी स्थिति में अपने भुगतान को अधिकतम करेगा। या तो सूचना सेट पर हमारे पास दो विकल्प हैं, चार में। प्लेयर 2 को चुनने वाले विकल्पों को समाप्त करके, हम अपने पेड़ को संकीर्ण कर सकते हैं। इस तरह, हम नीले रंग में उन पंक्तियों को चिह्नित करेंगे जो दिए गए सूचना सेट पर खिलाड़ी के भुगतान को अधिकतम करते हैं।

इस कमी के बाद, प्लेयर 1 अब अपने भुगतान को अधिकतम कर सकता है जो प्लेयर 2 की पसंद से जाना जाता है। परिणाम खिलाड़ी 1 के पिछड़े प्रेरण द्वारा पाया गया एक संतुलन है जो “सही” और प्लेयर 2 को “अप” चुनना है। नीचे दिए गए संतुलन के साथ खेल का हल है।

उदाहरण के लिए, कोई भी आसानी से खिलाड़ियों के रूप में कंपनियों के उपयोग से ऊपर एक गेम सेट कर सकता है। इस गेम में उत्पाद रिलीज़ परिदृश्य शामिल हो सकते हैं । यदि कंपनी 1 उत्पाद जारी करना चाहती है, तो कंपनी 2 की प्रतिक्रिया में क्या कर सकती है? क्या कंपनी 2 एक समान प्रतिस्पर्धी उत्पाद जारी करेगी? द्वारा भविष्यवाणी विभिन्न परिदृश्यों में इस नए उत्पाद की बिक्री, हम भविष्यवाणी करने के लिए कैसे घटनाओं उधेड़ना सकता है एक खेल स्थापित कर सकते हैं। नीचे एक उदाहरण है कि कोई इस तरह के खेल का मॉडल कैसे बना सकता है।

पीछे की ओर प्रेरण

पिछड़े हुए प्रेरण क्या है?

बैकवर्ड इंडक्शन समझाया

बैकवर्ड इंडक्शन का उदाहरण

पिछड़े प्रेरण का उपयोग करके अनुक्रमिक खेलों को हल करना

Categories

Recent Posts

पिछड़े हुए प्रेरण क्या है?

बैकवर्ड इंडक्शन समझाया

बैकवर्ड इंडक्शन का उदाहरण

पिछड़े प्रेरण का उपयोग करके अनुक्रमिक खेलों को हल करना

Related Posts

Categories

Recent Posts