नमूना चयन पूर्वाग्रह
नमूना चयन पूर्वाग्रह क्या है?
नमूना चयन पूर्वाग्रह एक प्रकार का पूर्वाग्रह है जो सांख्यिकीय विश्लेषण के लिए गैर-यादृच्छिक डेटा चुनने के कारण होता है। नमूना चयन प्रक्रिया में एक दोष के कारण पूर्वाग्रह मौजूद है, जहां किसी विशेष विशेषता के कारण डेटा का सबसेट व्यवस्थित रूप से बाहर रखा गया है। सबसेट का बहिष्करण परीक्षण के सांख्यिकीय महत्व को प्रभावित कर सकता है, और यह सांख्यिकीय मॉडल के मापदंडों के अनुमानों को पूर्वाग्रह कर सकता है।
नमूना चयन पूर्वाग्रह को समझना
उत्तरजीविता पूर्वाग्रह नमूना चयन पूर्वाग्रह का एक सामान्य प्रकार है। उदाहरण के लिए, जब शेयरों के एक बड़े समूह पर निवेश की रणनीति का बैक-टेस्ट किया जाता है, तो ऐसी प्रतिभूतियों की तलाश करना सुविधाजनक हो सकता है, जिसमें संपूर्ण नमूना अवधि के लिए डेटा हो। यदि हम 15 साल के स्टॉक डेटा के खिलाफ रणनीति का परीक्षण करने जा रहे हैं, तो हम उन शेयरों की तलाश में आ सकते हैं, जिनकी पूरी 15-वर्ष की अवधि के लिए पूरी जानकारी हो। हालांकि, एक स्टॉक को समाप्त करना, जिसने व्यापार बंद कर दिया, या शीघ्र ही बाजार छोड़ दिया, हमारे डेटा नमूने में एक पूर्वाग्रह इनपुट करेगा। चूंकि हम केवल 15-वर्ष की अवधि तक चलने वाले शेयरों को शामिल करते हैं, हमारे अंतिम परिणाम त्रुटिपूर्ण होंगे, क्योंकि ये बाजार में जीवित रहने के लिए पर्याप्त प्रदर्शन करते हैं।
हेज फंड प्रदर्शन सूचकांक, नमूना चयन पूर्वाग्रह के एक उदाहरण हैं जो जीवित रहने वाले पूर्वाग्रह के अधीन हैं। क्योंकि हेज फंड जो जीवित नहीं रहते हैं, वे अपने प्रदर्शन को इंडेक्स एग्रीगेटर्स को रिपोर्ट करना बंद कर देते हैं, जिसके परिणामस्वरूप सूचकांक स्वाभाविक रूप से फंड और रणनीतियों के लिए झुका रहता है, इसलिए “जीवित रहें।” यह लोकप्रिय म्यूचुअल फंड रिपोर्टिंग सेवाओं के साथ भी एक मुद्दा हो सकता है।
विश्लेषक इन पूर्वाग्रहों को ध्यान में रखते हुए समायोजित कर सकते हैं लेकिन इस प्रक्रिया में नए पूर्वाग्रहों का परिचय दे सकते हैं।