6 May 2021 5:53

स्तरीय अनियमित नमूने का चुनाव

स्तरीकृत यादृच्छिक नमूनाकरण क्या है?

स्तरीकृत यादृच्छिक नमूनाकरण नमूनाकरण की एक विधि है जिसमें एक आबादी के विभाजन को छोटे उप समूहों में शामिल किया जाता है जिन्हें स्ट्रेट कहा जाता है। में स्तरीकृत यादृच्छिक नमूना, या स्तरीकरण, तबके ऐसी आय या शिक्षा प्राप्ति के रूप में सदस्यों के साझा गुण या विशेषताओं के आधार पर बनते हैं।

स्तरीकृत यादृच्छिक नमूनाकरण को आनुपातिक यादृच्छिक नमूनाकरण या कोटा यादृच्छिक नमूनाकरण भी कहा जाता है।

चाबी छीन लेना

  • स्तरीकृत यादृच्छिक नमूना शोधकर्ताओं को एक नमूना आबादी प्राप्त करने की अनुमति देता है जो अध्ययन की जा रही पूरी आबादी का सबसे अच्छा प्रतिनिधित्व करता है।
  • स्तरीकृत यादृच्छिक नमूनाकरण में संपूर्ण आबादी को समरूप समूहों में विभाजित करना शामिल है जिन्हें समता कहा जाता है।
  • स्तरीकृत यादृच्छिक नमूना सरल यादृच्छिक नमूने से भिन्न होता है, जिसमें संपूर्ण आबादी से डेटा का यादृच्छिक चयन शामिल होता है, इसलिए प्रत्येक संभावित नमूना समान रूप से होने की संभावना है।

कैसे स्तरीकृत यादृच्छिक नमूनाकरण कार्य करता है

समान विशेषताओं वाली संस्थाओं के समूह पर विश्लेषण या अनुसंधान पूरा करते समय, एक शोधकर्ता यह पा सकता है कि जनसंख्या का आकार बहुत बड़ा है जिसके लिए अनुसंधान पूरा करना है। समय और पैसा बचाने के लिए, एक विश्लेषक आबादी से एक छोटे समूह का चयन करके अधिक व्यवहार्य दृष्टिकोण पर ले जा सकता है। छोटे समूह को एक नमूना आकार के रूप में संदर्भित किया जाता है, जो आबादी का एक सबसेट है जो संपूर्ण आबादी का प्रतिनिधित्व करने के लिए उपयोग किया जाता है। एक नमूने को जनसंख्या से कई तरीकों से चुना जा सकता है, जिनमें से एक स्तरीकृत यादृच्छिक नमूना विधि है।

एक स्तरीकृत रैंडम सैंपलिंग में पूरी आबादी को समतामूलक समूहों में विभाजित किया जाता है जिसे स्ट्रैटा ( स्ट्रैटम के लिए बहुवचन ) कहा जाता है यादृच्छिक नमूने तब प्रत्येक स्ट्रैटम से चुने जाते हैं। उदाहरण के लिए, एक अकादमिक शोधकर्ता पर विचार करें, जो 2007 में एमबीए के छात्रों की संख्या जानना चाहते हैं, जिन्होंने स्नातक होने के तीन महीने के भीतर नौकरी की पेशकश की थी।

वह जल्द ही पाएंगे कि वर्ष के लिए लगभग 200,000 एमबीए स्नातक थे। वह सरल यादृच्छिक नमूना लेने और एक सर्वेक्षण चलाने का फैसला कर सकता है । अभी भी बेहतर है, वह आबादी को तबाह कर सकता है और तबके से एक यादृच्छिक नमूना ले सकता है। ऐसा करने के लिए, वह लिंग, आयु सीमा, नस्ल, राष्ट्रीयता के देश और कैरियर की पृष्ठभूमि के आधार पर जनसंख्या समूह बनाएगा। जनसंख्या की तुलना में प्रत्येक स्ट्रैटम से एक रैंडम सैंपल स्ट्रैटम के आकार के अनुपात में लिया जाता है। तब स्ट्रैट के इन सबसेट को यादृच्छिक नमूना बनाने के लिए तैयार किया जाता है।

[महत्वपूर्ण: स्तरीकृत नमूनाकरण का उपयोग आबादी में समूहों के बीच अंतर को उजागर करने के लिए किया जाता है, जैसा कि सरल यादृच्छिक नमूनाकरण के विपरीत होता है, जो आबादी के सभी सदस्यों को समान माना जाता है, जिसका नमूना होने की समान संभावना है।]

स्तरीकृत यादृच्छिक नमूनाकरण का उदाहरण

मान लीजिए कि एक शोध टीम अमेरिका भर में कॉलेज के छात्रों के GPA का निर्धारण करना चाहती है, शोध टीम को सभी 21 मिलियन कॉलेज छात्रों से डेटा एकत्र करने में कठिनाई होती है; यह 4,000 छात्रों का उपयोग करके जनसंख्या का यादृच्छिक नमूना लेने का निर्णय करता है।

अब मान लें कि टीम नमूना प्रतिभागियों और चमत्कार के विभिन्न गुणों को देखती है अगर जीपीए और छात्रों की बड़ी मात्रा में कोई मतभेद हैं। मान लीजिए कि यह पता चलता है कि 560 छात्र इंग्लिश मेजर हैं, 1,135 साइंस मैजर्स हैं, 800 कंप्यूटर साइंस मेजर हैं, 1,090 इंजीनियरिंग मेजर्स हैं और 415 मैथ मेजर हैं। टीम एक आनुपातिक स्तरीकृत यादृच्छिक नमूने का उपयोग करना चाहती है जहां नमूने की परत आबादी में यादृच्छिक नमूने के लिए आनुपातिक है।

मान लें कि टीम  अमेरिका में कॉलेज के छात्रों की जनसांख्यिकी पर शोध करती है  और छात्रों के प्रतिशत का पता लगाती है: अंग्रेजी में 12% प्रमुख, विज्ञान में 28% प्रमुख, कंप्यूटर विज्ञान में 24% प्रमुख, इंजीनियरिंग में 21% प्रमुख, और 15% गणित में प्रमुख। इस प्रकार, स्तरीकृत यादृच्छिक नमूनाकरण प्रक्रिया से पांच स्ट्रैट बनाए जाते हैं।

तब टीम को यह पुष्टि करने की आवश्यकता है कि जनसंख्या का स्ट्रैटन नमूना में स्ट्रैटनम के अनुपात में है; हालाँकि, वे पाते हैं कि अनुपात समान नहीं हैं। इसके बाद टीम को आबादी से 4,000 छात्रों को फिर से नमूना लेने और बेतरतीब ढंग से 480 अंग्रेजी, 1,120 विज्ञान, 960 कंप्यूटर विज्ञान, 840 इंजीनियरिंग और 600 गणित के छात्रों का चयन करने की आवश्यकता है।

उन लोगों के साथ, इसमें कॉलेज के छात्रों का एक आनुपातिक स्तरीकृत यादृच्छिक नमूना है, जो यूएस में छात्रों के कॉलेज की बड़ी कंपनियों का बेहतर प्रतिनिधित्व प्रदान करता है। शोधकर्ता विशिष्ट स्ट्रैटम को उजागर कर सकते हैं, यूएस कॉलेज के छात्रों के अलग-अलग अध्ययनों का निरीक्षण कर सकते हैं और विभिन्न ग्रेड बिंदु औसत का निरीक्षण कर सकते हैं। ।

सरल यादृच्छिक बनाम स्तरीकृत यादृच्छिक नमूने

सरल यादृच्छिक नमूने  और स्तरीकृत यादृच्छिक नमूने दोनों सांख्यिकीय माप उपकरण हैं। संपूर्ण डेटा आबादी का प्रतिनिधित्व करने के लिए एक सरल यादृच्छिक नमूना का उपयोग किया जाता है। एक स्तरीकृत यादृच्छिक नमूना साझा विशेषताओं के आधार पर जनसंख्या को छोटे समूहों या वर्गों में विभाजित करता है।

सरल यादृच्छिक नमूना अक्सर उपयोग किया जाता है जब डेटा आबादी के बारे में बहुत कम जानकारी उपलब्ध होती है, जब डेटा आबादी में विभिन्न उप-भागों में विभाजित करने के लिए बहुत अधिक अंतर होते हैं, या जब डेटा आबादी के बीच केवल एक अलग विशेषता होती है।

उदाहरण के लिए, एक कैंडी कंपनी अपने उत्पाद की भविष्य की रेखा निर्धारित करने के लिए अपने ग्राहकों की खरीद की आदतों का अध्ययन करना चाह सकती है। यदि 10,000 ग्राहक हैं, तो यह उन 100 ग्राहकों को यादृच्छिक नमूने के रूप में चुन सकता है। यह तब लागू हो सकता है जो इसे उन 100 ग्राहकों से इसके आधार के बाकी हिस्सों में पाता है। स्तरीकरण के विपरीत, यह 100 सदस्यों को उनकी व्यक्तिगत विशेषताओं के बिना किसी भी संबंध में यादृच्छिक रूप से नमूना देगा।

आनुपातिक और अनुपातहीन स्तरीकरण

स्तरीकृत यादृच्छिक नमूना यह सुनिश्चित करता है कि किसी दिए गए आबादी के प्रत्येक उपसमूह को एक शोध अध्ययन के पूरे नमूना आबादी के भीतर पर्याप्त रूप से दर्शाया गया है। स्तरीकरण आनुपातिक या अनुपातहीन हो सकता है। आनुपातिक स्तरीकृत विधि में, प्रत्येक स्ट्रैटम का नमूना आकार स्ट्रैटम के जनसंख्या आकार के अनुपात में होता है।

उदाहरण के लिए, यदि शोधकर्ता आयु सीमा का उपयोग करते हुए 50,000 स्नातकों का एक नमूना चाहता था, तो इस सूत्र का उपयोग करके आनुपातिक स्तरीकृत यादृच्छिक नमूना प्राप्त किया जाएगा: (नमूना आकार / जनसंख्या आकार) एक्स स्ट्रेटम आकार। नीचे दी गई तालिका में प्रति वर्ष 180,000 एमबीए स्नातकों की जनसंख्या का आकार माना जाता है।

24 से 28 वर्ष की आयु में एमबीए स्नातकों के लिए स्ट्रेट सैंपल साइज (50,000 / 180,000) x 90,000 / 25,000 के रूप में गणना की जाती है। उसी विधि का उपयोग अन्य आयु सीमा समूहों के लिए किया जाता है। अब जब स्ट्रैट सैंपल साइज ज्ञात हो गया है, तो शोधकर्ता अपने सर्वेक्षण प्रतिभागियों का चयन करने के लिए प्रत्येक स्ट्रैटम में सरल यादृच्छिक नमूना प्रदर्शन कर सकते हैं। दूसरे शब्दों में, 24-28 आयु वर्ग के 25,000 स्नातकों को पूरी आबादी से यादृच्छिक रूप से चुना जाएगा, 29-33 आयु वर्ग के 16,667 स्नातकों को यादृच्छिक रूप से आबादी से चुना जाएगा, और इसी तरह।

एक विषम स्तरीकृत नमूने में, प्रत्येक स्ट्रैटम का आकार जनसंख्या में इसके आकार के अनुपात में नहीं है। शोधकर्ता 34-37 आयु वर्ग के भीतर स्नातकों में से 1/2 को और 29-33 आयु वर्ग के स्नातकों में से 1/3 को नमूना करने का निर्णय ले सकता है।

यह ध्यान रखना महत्वपूर्ण है कि एक व्यक्ति कई स्तरों में फिट नहीं हो सकता है। प्रत्येक इकाई को केवल एक स्ट्रैटम में फिट होना चाहिए। ओवरगैपिंग उप-समूह होने का मतलब है कि कुछ व्यक्तियों को सर्वेक्षण के लिए चुने जाने की अधिक संभावना होगी, जो एक प्रकार की संभावना नमूने के रूप में स्तरीकृत नमूने की अवधारणा को पूरी तरह से नकार देता है।



पोर्टफोलियो मैनेजर स्ट्रेंथेड रैंडम सैंपलिंग का इस्तेमाल बॉन्ड इंडेक्स जैसे इंडेक्स की प्रतिकृति बनाकर कर सकते हैं।

स्तरीकृत यादृच्छिक नमूनाकरण के लाभ

स्तरीकृत यादृच्छिक नमूने का मुख्य लाभ यह है कि यह नमूने में प्रमुख जनसंख्या विशेषताओं को कैप्चर करता है। एक भारित औसत के समान, नमूनाकरण की यह विधि नमूने में विशेषताओं का उत्पादन करती है जो समग्र आबादी के आनुपातिक हैं। स्तरीकृत यादृच्छिक नमूना विभिन्न प्रकार की विशेषताओं के साथ आबादी के लिए अच्छी तरह से काम करता है, लेकिन अन्यथा अप्रभावी है यदि उपसमूह का गठन नहीं किया जा सकता है।

स्तरीकरण अनुमान में एक छोटी सी त्रुटि देता है और सरल यादृच्छिक नमूना विधि की तुलना में अधिक सटीक होता है। स्ट्रैट के बीच अंतर जितना अधिक होगा, परिशुद्धता में अधिक लाभ होगा।

स्तरीकृत यादृच्छिक नमूनाकरण के नुकसान

दुर्भाग्य से, अनुसंधान की इस पद्धति का उपयोग हर अध्ययन में नहीं किया जा सकता है। विधि का नुकसान यह है कि इसे ठीक से उपयोग करने के लिए कई शर्तों को पूरा करना चाहिए। शोधकर्ताओं को अध्ययन की जा रही आबादी के प्रत्येक सदस्य की पहचान करनी चाहिए और उनमें से प्रत्येक को एक में वर्गीकृत करना चाहिए, और केवल एक, उप-विभाजन। परिणामस्वरूप, स्तरीकृत यादृच्छिक नमूना नुकसानदायक होता है जब शोधकर्ता जनसंख्या के प्रत्येक सदस्य को विश्वासपूर्वक उपसमूह में वर्गीकृत नहीं कर सकते। इसके अलावा, संपूर्ण आबादी की एक संपूर्ण और निश्चित सूची को   खोजना चुनौतीपूर्ण हो सकता है।

ओवरलैपिंग एक मुद्दा हो सकता है यदि ऐसे विषय हैं जो कई उपसमूहों में आते हैं। जब सरल यादृच्छिक नमूना किया जाता है, तो जो कई उपसमूहों में होते हैं उन्हें चुने जाने की अधिक संभावना होती है। परिणाम आबादी का गलत चित्रण या गलत प्रतिबिंब हो सकता है।

उपरोक्त उदाहरण इसे आसान बनाते हैं: स्नातक, स्नातक, पुरुष और महिला स्पष्ट रूप से परिभाषित समूह हैं। अन्य स्थितियों में, हालांकि, यह कहीं अधिक कठिन हो सकता है। दौड़, जातीयता या धर्म जैसी विशेषताओं को शामिल करने की कल्पना करें। छँटाई प्रक्रिया अधिक कठिन हो जाती है, स्तरीकृत यादृच्छिक नमूने का अप्रभावी और आदर्श विधि से कम प्रतिपादन।