5 May 2021 14:10

पीछे की ओर प्रेरण

पिछड़े हुए प्रेरण क्या है?

गेम थ्योरी में बैकवर्ड इंडक्शन एक समस्या या स्थिति के अंत से समय में पिछड़े तर्क की एक पुनरावृत्ति प्रक्रिया है, जो परिमित व्यापक रूप और अनुक्रमिक गेम को हल करने के लिए, और इष्टतम कार्यों के अनुक्रम का अनुमान लगाती है।

बैकवर्ड इंडक्शन समझाया

जॉन वॉन न्यूमैन और ऑस्कर मोर्गनस्टर्न स्थापित गेम थ्योरी को अकादमिक विषय के रूप में स्थापित करने के बाद से बैकवर्ड इंडक्शन का इस्तेमाल किया गया, जब उन्होंने 1944 में अपनी पुस्तक, थ्योरी ऑफ़ गेम्स और इकोनॉमिक बिहेवियर को प्रकाशित किया ।

खेल के प्रत्येक चरण में पिछड़े प्रेरण खिलाड़ी की इष्टतम रणनीति को निर्धारित करता है जो खेल में अंतिम चाल बनाता है। फिर, अगले-से-अंतिम मूविंग प्लेयर की इष्टतम कार्रवाई निर्धारित की जाती है, अंतिम खिलाड़ी की कार्रवाई को देखते हुए। यह प्रक्रिया तब तक पिछड़ी रहती है जब तक कि हर बिंदु के लिए सबसे अच्छी कार्रवाई निर्धारित नहीं की गई है। प्रभावी रूप से, कोई मूल खेल के प्रत्येक उपगेम के नैश संतुलन का निर्धारण कर रहा है ।

हालांकि, पिछड़े प्रेरण से निकले परिणाम अक्सर वास्तविक मानव खेल की भविष्यवाणी करने में विफल होते हैं। प्रायोगिक अध्ययनों से पता चला है कि “तर्कसंगत” व्यवहार (जैसा कि खेल सिद्धांत द्वारा भविष्यवाणी की गई है) शायद ही कभी वास्तविक जीवन में प्रदर्शित होता है। तर्कहीन खिलाड़ी वास्तव में पिछड़े प्रेरण द्वारा भविष्यवाणी की तुलना में उच्च भुगतान प्राप्त कर सकते हैं, जैसा कि सेंटीपीड गेम में चित्रित किया गया है ।

सेंटीपीड गेम में, दो खिलाड़ियों को बारी-बारी से पैसे के बढ़ते बर्तन का बड़ा हिस्सा लेने का मौका मिलता है, या दूसरे खिलाड़ी को बर्तन पास करने का मौका मिलता है। अदायगी की व्यवस्था इसलिए की जाती है कि यदि किसी के प्रतिद्वंद्वी को पॉट पास किया जाता है और प्रतिद्वंद्वी अगले राउंड पर पॉट लेता है, तो व्यक्ति इस राउंड पर पॉट ले जाने की तुलना में थोड़ा कम प्राप्त करता है। जैसे ही एक खिलाड़ी स्लैश लेता है, उस खिलाड़ी का बड़ा हिस्सा हो जाता है और दूसरे खिलाड़ी का छोटा हिस्सा हो जाता है।

बैकवर्ड इंडक्शन का उदाहरण

एक उदाहरण के रूप में, मान लें कि प्लेयर ए पहले जाता है और यह तय करना होता है कि उसे “ले जाना” या “पास” करना चाहिए, जो वर्तमान में $ 2 तक है। यदि वह लेता है, तो ए और बी को $ 1 प्रत्येक मिलता है, लेकिन यदि ए पास होता है, तो अब लेने या पास करने का निर्णय प्लेयर बी द्वारा किया जाना है। यदि बी लेता है, तो उसे $ 3 मिलता है (यानी, $ 2 + $ 1 का पिछला स्लैश) और A को $ 0 मिलता है। लेकिन यदि बी पास हो जाता है, तो ए को अब यह तय करना होगा कि क्या लेना है या पास करना है, और इसी तरह। यदि दोनों खिलाड़ी हमेशा पास करना चुनते हैं, तो वे खेल के अंत में $ 100 का भुगतान प्राप्त करते हैं।

खेल की बात यह है कि यदि A और B दोनों सहयोग करते हैं और खेल के अंत तक पास करना जारी रखते हैं, तो उन्हें प्रत्येक $ 100 का अधिकतम भुगतान प्राप्त होता है। लेकिन अगर वे दूसरे खिलाड़ी का अविश्वास करते हैं और उनसे उम्मीद करते हैं कि पहले मौके पर “ले” करेंगे, तो नैश संतुलन की भविष्यवाणी करता है कि खिलाड़ी सबसे कम संभव दावा करेंगे (इस मामले में $ 1)।

इस खेल का नैश संतुलन, जहां किसी भी खिलाड़ी को प्रतिद्वंद्वी की पसंद पर विचार करने के बाद अपनी चुनी हुई रणनीति से विचलित करने का प्रोत्साहन नहीं होता है, पहले खिलाड़ी को खेल के पहले दौर में पॉट लेने का सुझाव देता है। हालांकि, वास्तव में, अपेक्षाकृत कम खिलाड़ी ऐसा करते हैं। नतीजतन, उन्हें संतुलन विश्लेषण द्वारा भविष्यवाणी की गई अदायगी की तुलना में अधिक भुगतान मिलता है।

पिछड़े प्रेरण का उपयोग करके अनुक्रमिक खेलों को हल करना

नीचे दो खिलाड़ियों के बीच एक सरल अनुक्रमिक खेल है। उनके भीतर प्लेयर 1 और प्लेयर 2 के साथ लेबल क्रमशः एक या दो खिलाड़ियों के लिए सूचना सेट हैं। पेड़ के नीचे कोष्ठक में संख्या प्रत्येक संबंधित बिंदु पर अदायगी है। खेल भी अनुक्रमिक है, इसलिए प्लेयर 1 पहला निर्णय (बाएं या दाएं) करता है और प्लेयर 2 प्लेयर 1 (ऊपर या नीचे) के बाद अपना निर्णय लेता है।

बैकवर्ड इंडक्शन, सभी खेल सिद्धांत की तरह, तर्कसंगतता और अधिकतमकरण की धारणाओं का उपयोग करता है, जिसका अर्थ है कि खिलाड़ी 2 किसी भी स्थिति में अपने भुगतान को अधिकतम करेगा। या तो सूचना सेट पर हमारे पास दो विकल्प हैं, चार में। प्लेयर 2 को चुनने वाले विकल्पों को समाप्त करके, हम अपने पेड़ को संकीर्ण कर सकते हैं। इस तरह, हम नीले रंग में उन पंक्तियों को चिह्नित करेंगे जो दिए गए सूचना सेट पर खिलाड़ी के भुगतान को अधिकतम करते हैं।

इस कमी के बाद, प्लेयर 1 अब अपने भुगतान को अधिकतम कर सकता है जो प्लेयर 2 की पसंद से जाना जाता है। परिणाम खिलाड़ी 1 के पिछड़े प्रेरण द्वारा पाया गया एक संतुलन है जो “सही” और प्लेयर 2 को “अप” चुनना है। नीचे दिए गए संतुलन के साथ खेल का हल है।

उदाहरण के लिए, कोई भी आसानी से खिलाड़ियों के रूप में कंपनियों के उपयोग से ऊपर एक गेम सेट कर सकता है। इस गेम में उत्पाद रिलीज़ परिदृश्य शामिल हो सकते हैं । यदि कंपनी 1 उत्पाद जारी करना चाहती है, तो कंपनी 2 की प्रतिक्रिया में क्या कर सकती है? क्या कंपनी 2 एक समान प्रतिस्पर्धी उत्पाद जारी करेगी? द्वारा भविष्यवाणी विभिन्न परिदृश्यों में इस नए उत्पाद की बिक्री, हम भविष्यवाणी करने के लिए कैसे घटनाओं उधेड़ना सकता है एक खेल स्थापित कर सकते हैं। नीचे एक उदाहरण है कि कोई इस तरह के खेल का मॉडल कैसे बना सकता है।