सरल यादृच्छिक बनाम स्तरीकृत यादृच्छिक नमूना: क्या अंतर है? - KamilTaylan.blog
6 May 2021 8:42

सरल यादृच्छिक बनाम स्तरीकृत यादृच्छिक नमूना: क्या अंतर है?

सरल यादृच्छिक बनाम स्तरीकृत यादृच्छिक नमूना: एक अवलोकन

सांख्यिकीय विश्लेषण में, ” जनसंख्या ” टिप्पणियों या डेटा का कुल समूह है जो मौजूद है। हालांकि, आबादी में प्रत्येक व्यक्ति या डेटा बिंदु को मापने के लिए अक्सर यह अक्षम्य है। इसके बजाय, शोधकर्ता नमूनों पर भरोसा करते हैं। एक नमूना आबादी से टिप्पणियों का एक सेट है। नमूनाकरण विधि वह प्रक्रिया है जिसका उपयोग जनसंख्या से नमूने खींचने के लिए किया जाता है।

सरल यादृच्छिक नमूने और स्तरीकृत यादृच्छिक नमूने एक नमूना प्राप्त करने के लिए दोनों सामान्य तरीके हैं। संपूर्ण डेटा आबादी का प्रतिनिधित्व करने के लिए एक सरल यादृच्छिक नमूना का उपयोग किया जाता है। और किसी भी अन्य विचार के बिना जनसंख्या से लोगों का चयन करता है।

एक स्तरीकृत यादृच्छिक नमूना, दूसरी ओर, पहले साझा विशेषताओं के आधार पर जनसंख्या को छोटे समूहों, या तबकों में विभाजित करता है। इसलिए, एक स्तरीकृत नमूनाकरण रणनीति यह सुनिश्चित करेगी कि प्रत्येक उपसमूह से सदस्य डेटा विश्लेषण में शामिल हैं।

चाबी छीन लेना

  • सरल यादृच्छिक और स्तरीकृत यादृच्छिक नमूने सांख्यिकीय माप उपकरण हैं।
  • एक साधारण यादृच्छिक नमूना पूरे डेटा सेट का प्रतिनिधित्व करने के लिए पूरी आबादी का एक छोटा, बुनियादी हिस्सा लेता है।
  • जनसंख्या को विभिन्न समूहों में विभाजित किया जाता है जो समान विशेषताओं को साझा करते हैं, जिसमें से एक स्तरीकृत यादृच्छिक नमूना लिया जाता है।

सरल यादृच्छिक नमूना

सरल यादृच्छिक नमूनाकरण एक सांख्यिकीय उपकरण है जिसका उपयोग डेटा आबादी से लिए गए एक बहुत ही बुनियादी नमूने का वर्णन करने के लिए किया जाता है। यह नमूना पूरी आबादी के बराबर का प्रतिनिधित्व करता है।

सरल यादृच्छिक नमूना अक्सर उपयोग किया जाता है जब डेटा आबादी के बारे में बहुत कम जानकारी उपलब्ध होती है, जब डेटा आबादी में विभिन्न उप-भागों में विभाजित करने के लिए बहुत अधिक अंतर होते हैं, या जब डेटा आबादी के बीच केवल एक अलग विशेषता होती है।

उदाहरण के लिए, एक कैंडी कंपनी अपने उत्पाद की भविष्य की रेखा निर्धारित करने के लिए अपने ग्राहकों की खरीद की आदतों का अध्ययन करना चाह सकती है। यदि 10,000 ग्राहक हैं, तो यह उन 100 ग्राहकों को यादृच्छिक नमूने के रूप में चुन सकता है। यह तब लागू हो सकता है जो इसे उन 100 ग्राहकों से इसके आधार के बाकी हिस्सों में पाता है।

सांख्यिकीविद एक डेटा आबादी की एक विस्तृत सूची तैयार करेंगे और फिर उस बड़े समूह के भीतर एक यादृच्छिक नमूने का चयन करेंगे। इस नमूने में, जनसंख्या के प्रत्येक सदस्य को नमूने का हिस्सा बनने के लिए चुने जाने की समान संभावना है। उन्हें दो तरीकों से चुना जा सकता है:

  • एक मैनुअल लॉटरी के माध्यम से, जिसमें आबादी के प्रत्येक सदस्य को एक नंबर दिया जाता है। फिर नमूने में किसी को शामिल करने के लिए संख्याओं को यादृच्छिक रूप से तैयार किया जाता है। एक छोटे समूह को देखते समय इसका सबसे अच्छा उपयोग किया जाता है।
  • कंप्यूटर जनित नमूना। यह विधि मानव के बजाय नमूनों का चयन करने के लिए कंप्यूटर का उपयोग करके, बड़े डेटा सेट के साथ सबसे अच्छा काम करती है।

सरल यादृच्छिक नमूने का उपयोग करना शोधकर्ताओं को एक विशिष्ट आबादी के बारे में सामान्यीकरण करने और किसी भी पूर्वाग्रह को छोड़ने की अनुमति देता है। इससे भविष्य के निर्णय लेने में मदद मिल सकती है। ताकि ऊपर के उदाहरण से कैंडी कंपनी इस उपकरण का उपयोग 100 ग्राहकों के वर्तमान स्वाद के आधार पर एक नया कैंडी स्वाद विकसित करने के लिए कर सके। लेकिन ध्यान रखें, ये सामान्यीकरण हैं, इसलिए त्रुटि के लिए जगह है। आखिरकार, यह एक सरल नमूना है। उन 100 ग्राहकों के पास पूरी आबादी के स्वाद का सटीक प्रतिनिधित्व नहीं हो सकता है।

स्तरीय अनियमित नमूने का चुनाव

सरल यादृच्छिक नमूनों के विपरीत, स्तरीकृत यादृच्छिक नमूनों का उपयोग आबादी के साथ किया जाता है जो आसानी से अलग-अलग उपसमूहों या सबसेट में टूट सकते हैं। ये समूह कुछ मानदंडों पर आधारित होते हैं, फिर समूह के आकार बनाम आबादी के अनुपात में प्रत्येक से यादृच्छिक रूप से तत्वों का चयन करते हैं।

नमूना लेने की इस विधि का अर्थ है कि प्रत्येक अलग समूह से चयन होगा- जिसका आकार पूरी आबादी के अनुपात पर आधारित है। लेकिन शोधकर्ताओं को यह सुनिश्चित करना चाहिए कि स्ट्रैट ओवरलैप न करें। जनसंख्या में प्रत्येक बिंदु को केवल एक स्तर से संबंधित होना चाहिए ताकि प्रत्येक बिंदु पारस्परिक रूप से अनन्य हो । ओवरलैपिंग स्ट्रैटा की संभावना बढ़ जाती है कि कुछ डेटा शामिल हैं, इस प्रकार नमूना तिरछा करना।

कैंडी कंपनी अपने 100 ग्राहकों को विभिन्न आयु समूहों में विभाजित करके यादृच्छिक स्तरीकृत नमूनाकरण विधि का उपयोग करने का निर्णय ले सकती है ताकि इसके उत्पादन के भविष्य के बारे में निर्णय लेने में मदद मिल सके।



पोर्टफोलियो मैनेजर स्ट्रेंथेड रैंडम सैंपलिंग का इस्तेमाल बॉन्ड इंडेक्स जैसे इंडेक्स की प्रतिकृति बनाकर कर सकते हैं।

स्तरीकृत नमूनाकरण सरल यादृच्छिक नमूने की तुलना में कुछ फायदे और नुकसान प्रदान करता है। क्योंकि यह विशिष्ट विशेषताओं का उपयोग करता है, यह जनसंख्या का अधिक सटीक प्रतिनिधित्व प्रदान कर सकता है जो कि इसे अलग-अलग सबसेट में विभाजित करने के लिए उपयोग किया जाता है। इसके लिए अक्सर एक छोटे नमूने के आकार की आवश्यकता होती है, जो संसाधनों और समय को बचा सकता है। इसके अलावा, प्रत्येक स्ट्रैटम से पर्याप्त नमूना बिंदुओं को शामिल करके, शोधकर्ता प्रत्येक व्यक्ति स्ट्रैटम पर एक अलग विश्लेषण कर सकते हैं।

लेकिन एक यादृच्छिक नमूने की तुलना में एक स्तरीकृत नमूने को खींचने के लिए अधिक काम की आवश्यकता होती है। शोधकर्ताओं को व्यक्तिगत रूप से शामिल करने के लिए प्रत्येक स्ट्रैटम के डेटा को ट्रैक और सत्यापित करना चाहिए, जो यादृच्छिक नमूनाकरण की तुलना में बहुत अधिक समय ले सकता है।