6 May 2021 6:07

टी परीक्षण

टी-टेस्ट क्या है?

एक टी-टेस्ट एक प्रकार का अनुमानात्मक आँकड़ा है जो यह निर्धारित करने के लिए उपयोग किया जाता है कि क्या दो समूहों के साधनों के बीच एक महत्वपूर्ण अंतर है, जो कुछ विशेषताओं में संबंधित हो सकता है। इसका उपयोग ज्यादातर तब किया जाता है जब डेटा सेट, जैसे कि डेटा सेट को 100 बार सिक्के को फ़्लिप करने से होने वाले परिणाम के रूप में दर्ज किया जाता है, एक सामान्य वितरण का पालन करेगा और इसमें अज्ञात परिवर्तन हो सकते हैं। एक टी-टेस्ट का उपयोग एक परिकल्पना परीक्षण उपकरण के रूप में किया जाता है, जो आबादी पर लागू धारणा का परीक्षण करने की अनुमति देता है । 

एक टी-टेस्ट, टी-स्टेटिस्टिक, टी-डिस्ट्रीब्यूशन वैल्यूज़ और फ्रीडम की डिग्रियों को स्टैटिस्टिकल महत्व देने के लिए देखता है। तीन या अधिक साधनों के साथ परीक्षण करने के लिए, किसी को विचरण के विश्लेषण का उपयोग करना चाहिए  ।

चाबी छीन लेना

  • एक टी-टेस्ट एक प्रकार का अनुमानात्मक आँकड़ा है जो यह निर्धारित करने के लिए उपयोग किया जाता है कि क्या दो समूहों के साधनों के बीच एक महत्वपूर्ण अंतर है, जो कुछ विशेषताओं में संबंधित हो सकता है।
  • टी-टेस्ट आंकड़ों में परिकल्पना परीक्षण के उद्देश्य से उपयोग किए जाने वाले कई परीक्षणों में से एक है ।
  • टी-टेस्ट की गणना के लिए तीन प्रमुख डेटा मानों की आवश्यकता होती है। वे प्रत्येक डेटा सेट (माध्य अंतर कहा जाता है), प्रत्येक समूह के मानक विचलन और प्रत्येक समूह के डेटा मूल्यों की संख्या से औसत मानों के बीच अंतर को शामिल करते हैं।
  • कई अलग-अलग प्रकार के टी-टेस्ट हैं जो आवश्यक डेटा और विश्लेषण के प्रकार के आधार पर किए जा सकते हैं।

टी-टेस्ट के बारे में बताते हुए

अनिवार्य रूप से, एक टी-टेस्ट हमें दो डेटा सेटों के औसत मूल्यों की तुलना करने और यह निर्धारित करने की अनुमति देता है कि क्या वे एक ही आबादी से आए हैं। उपरोक्त उदाहरणों में, यदि हम कक्षा A के छात्रों का एक नमूना लेते हैं और कक्षा B के छात्रों का एक और नमूना लेते हैं, तो हम उनसे बिल्कुल यही मतलब और मानक विचलन नहीं लेंगे। इसी प्रकार, प्लेसबो-फ़ेड कंट्रोल ग्रुप से लिए गए नमूने और दवा निर्धारित समूह से लिए गए नमूनों का थोड़ा अलग मतलब और मानक विचलन होना चाहिए।

गणितीय रूप से, टी-टेस्ट दो सेटों में से प्रत्येक से एक नमूना लेता है और एक शून्य परिकल्पना मानकर समस्या कथन को स्थापित करता है कि दो साधन समान हैं। लागू फ़ार्मुलों के आधार पर, कुछ मानों की गणना और मानक मानों की तुलना में की जाती है, और मान ली गई अशक्त परिकल्पना को स्वीकार या अस्वीकार कर दिया जाता है।

यदि अशक्त परिकल्पना खारिज होने के योग्य है, तो यह इंगित करता है कि डेटा रीडिंग मजबूत हैं और संभवतः मौका के कारण नहीं हैं। टी-टेस्ट इस उद्देश्य के लिए उपयोग किए जाने वाले कई परीक्षणों में से एक है। सांख्यिकीविदों को इसके अतिरिक्त परीक्षण का उपयोग करना चाहिए, बड़े आकार के साथ अधिक चर और परीक्षणों की जांच करने के लिए टी-टेस्ट के अलावा। एक बड़े नमूने के आकार के लिए, सांख्यिकीविद् एक जेड-परीक्षण का उपयोग करते हैं  । अन्य परीक्षण विकल्पों में ची-स्क्वायर टेस्ट और एफ-टेस्ट शामिल हैं।

तीन प्रकार के टी-टेस्ट हैं, और उन्हें आश्रित और स्वतंत्र टी-टेस्ट के रूप में वर्गीकृत किया गया है।

अस्पष्ट परीक्षण के परिणाम

विचार करें कि एक दवा निर्माता एक नई आविष्कार की गई दवा का परीक्षण करना चाहता है। यह रोगियों के एक समूह पर दवा की कोशिश करने और नियंत्रण समूह नामक एक अन्य समूह को प्लेसबो देने की मानक प्रक्रिया का पालन करता है। नियंत्रण समूह को दिया गया प्लेसबो बिना किसी चिकित्सीय मूल्य के एक पदार्थ है और यह मापने के लिए एक बेंचमार्क के रूप में कार्य करता है कि दूसरे समूह को, जिसे वास्तविक दवा दी जाती है, प्रतिक्रिया देता है।

ड्रग ट्रायल के बाद, प्लेसबो-फेड कंट्रोल ग्रुप के सदस्यों ने तीन साल की औसत जीवन प्रत्याशा में वृद्धि की सूचना दी, जबकि समूह के सदस्यों को जो नई दवा निर्धारित करते हैं, औसत जीवन प्रत्याशा में चार साल की वृद्धि की रिपोर्ट करते हैं। त्वरित अवलोकन यह संकेत दे सकता है कि दवा वास्तव में काम कर रही है क्योंकि दवा का उपयोग करने वाले समूह के लिए परिणाम बेहतर हैं। हालांकि, यह भी संभव है कि अवलोकन एक मौका घटना के कारण हो सकता है, विशेष रूप से भाग्य का एक आश्चर्यजनक टुकड़ा। यदि परिणाम वास्तव में सही हैं और संपूर्ण जनसंख्या पर लागू होते हैं, तो निष्कर्ष निकालने के लिए एक टी-टेस्ट उपयोगी है।

एक स्कूल में, कक्षा ए में 100 छात्रों ने 3% के मानक विचलन के साथ औसतन 85% स्कोर किया। कक्षा बी से संबंधित 100 अन्य छात्रों ने 4% के मानक विचलन के साथ औसतन 87% स्कोर किया। जबकि कक्षा B का औसत कक्षा A की तुलना में बेहतर है, इस निष्कर्ष पर कूदना सही नहीं हो सकता है कि कक्षा B में छात्रों का समग्र प्रदर्शन कक्षा A के छात्रों की तुलना में बेहतर है। ऐसा इसलिए है क्योंकि इसमें प्राकृतिक परिवर्तनशीलता है दोनों वर्गों में परीक्षा स्कोर में, इसलिए अंतर अकेले मौका के कारण हो सकता है। एक टी-टेस्ट यह निर्धारित करने में मदद कर सकता है कि क्या एक वर्ग दूसरे की तुलना में बेहतर प्रदर्शन करता है।

टी-टेस्ट मान्यताओं

  1. टी-परीक्षणों के संबंध में की गई पहली धारणा माप के पैमाने की चिंता करती है। टी-टेस्ट के लिए धारणा यह है कि एकत्र किए गए डेटा पर लागू माप का पैमाना एक निरंतर या क्रमिक पैमाने का अनुसरण करता है, जैसे कि आईक्यू टेस्ट के लिए स्कोर।
  2. दूसरी धारणा यह है कि एक साधारण यादृच्छिक नमूना, कि डेटा को कुल आबादी के यादृच्छिक रूप से चयनित प्रतिनिधि से एकत्र किया जाता है।
  3. तीसरी धारणा डेटा है, जब प्लॉट किया जाता है, तो सामान्य वितरण, घंटी के आकार का वितरण वक्र होता है।
  4. अंतिम धारणा विचरण की समरूपता है। समरूप, या समान, विचरण मौजूद है जब नमूनों के मानक विचलन लगभग बराबर हैं।

टी-टेस्ट की गणना

टी-टेस्ट की गणना के लिए तीन प्रमुख डेटा मानों की आवश्यकता होती है। वे प्रत्येक डेटा सेट (माध्य अंतर कहा जाता है), प्रत्येक समूह के मानक विचलन और प्रत्येक समूह के डेटा मूल्यों की संख्या से औसत मानों के बीच अंतर को शामिल करते हैं।

टी-टेस्ट के परिणाम टी-मूल्य का उत्पादन करते हैं। इसके बाद गणना की गई टी-वैल्यू की तुलना क्रिटिकल वैल्यू टेबल ( टी-डिस्ट्रीब्यूशन टेबल ) से प्राप्त मूल्य से की जाती है । यह तुलना अंतर पर अकेले मौके के प्रभाव को निर्धारित करने में मदद करती है, और क्या अंतर उस मौका सीमा के बाहर है। टी-टेस्ट सवाल करता है कि क्या समूहों के बीच का अंतर अध्ययन में सही अंतर का प्रतिनिधित्व करता है या यदि यह संभवतः एक अर्थहीन यादृच्छिक अंतर है।

T- वितरण तालिकाएँ

टी-डिस्ट्रीब्यूशन टेबल वन-टेल और टू-टेल फॉर्मेट में उपलब्ध है। पूर्व का उपयोग उन मामलों का आकलन करने के लिए किया जाता है जिनके पास एक स्पष्ट दिशा (सकारात्मक या नकारात्मक) के साथ एक निश्चित मूल्य या सीमा होती है। उदाहरण के लिए, -3 से नीचे आउटपुट मूल्य की संभावना क्या है, या पासा की एक जोड़ी को रोल करते समय सात से अधिक हो रही है? उत्तरार्द्ध का उपयोग सीमाबद्ध विश्लेषण के लिए किया जाता है, जैसे कि यह पूछना कि क्या निर्देशांक -2 और +2 के बीच आते हैं।

गणना मानक सॉफ्टवेयर प्रोग्राम के साथ की जा सकती है जो आवश्यक सांख्यिकीय कार्यों का समर्थन करते हैं, जैसे कि एमएस एक्सेल में पाए जाते हैं।

टी-मूल्यों और स्वतंत्रता की डिग्री

टी-टेस्ट अपने आउटपुट के रूप में दो मूल्यों का उत्पादन करता है: टी-मूल्य और स्वतंत्रता की डिग्री । टी-वैल्यू दो सैंपल सेटों के बीच के अंतर और सैंपल सेट्स के भीतर मौजूद भिन्नता का अनुपात है। जबकि संख्यात्मक मान (दो नमूना सेटों के बीच का अंतर) गणना के लिए सीधा है, भाजक (नमूना सेटों के भीतर मौजूद भिन्नता) शामिल डेटा मानों के प्रकार के आधार पर थोड़ा जटिल हो सकता है। अनुपात का भाजक फैलाव या परिवर्तनशीलता का माप है। टी-मान के उच्च मूल्य, जिसे टी-स्कोर भी कहा जाता है, यह दर्शाता है कि दो नमूना सेटों के बीच एक बड़ा अंतर मौजूद है। टी-वैल्यू जितना छोटा होगा, दो सैंपल सेट्स के बीच उतनी ही समानता होगी।

  • एक बड़ा टी-स्कोर इंगित करता है कि समूह अलग-अलग हैं।
  • एक छोटा टी-स्कोर इंगित करता है कि समूह समान हैं।

स्वतंत्रता की डिग्री एक अध्ययन में मूल्यों को संदर्भित करती है जिसमें अलग-अलग होने की स्वतंत्रता है और महत्व और शून्य परिकल्पना की वैधता का आकलन करने के लिए आवश्यक है। इन मूल्यों की गणना आमतौर पर नमूना सेट में उपलब्ध डेटा रिकॉर्ड की संख्या पर निर्भर करती है।

सहसंबंधित (या जोड़ीदार) टी-टेस्ट

सहसंबद्ध टी-परीक्षण तब किया जाता है जब नमूने आमतौर पर समान इकाइयों के मिलान जोड़े से मिलकर होते हैं, या जब दोहराए गए उपायों के मामले होते हैं। उदाहरण के लिए, एक ही रोगियों के बार-बार परीक्षण किए जाने के उदाहरण हो सकते हैं – एक विशेष उपचार प्राप्त करने से पहले और बाद में। ऐसे मामलों में, प्रत्येक रोगी को अपने खिलाफ नियंत्रण नमूने के रूप में इस्तेमाल किया जा रहा है।

यह विधि उन मामलों पर भी लागू होती है जहाँ नमूने किसी न किसी तरीके से संबंधित होते हैं या उनमें मिलान की विशेषताएँ होती हैं, जैसे बच्चों, माता-पिता या भाई-बहनों से तुलनात्मक विश्लेषण। सहसंबंधित या युग्मित टी-परीक्षण एक आश्रित प्रकार के होते हैं, क्योंकि इनमें ऐसे मामले शामिल होते हैं जहाँ नमूनों के दो सेट संबंधित होते हैं।

युग्मित टी-टेस्ट के लिए टी-मान और स्वतंत्रता की डिग्री के लिए सूत्र है:

शेष दो प्रकार स्वतंत्र टी-टेस्ट के हैं। इन प्रकारों के नमूनों को एक-दूसरे से स्वतंत्र चुना जाता है – यानी, दो समूहों में डेटा सेट एक ही मूल्यों को संदर्भित नहीं करते हैं। इनमें 100 रोगियों के समूह में से 50 रोगियों के दो सेटों में विभाजित होने जैसे मामले शामिल हैं। समूहों में से एक नियंत्रण समूह बन जाता है और उसे एक प्लेसबो दिया जाता है, जबकि दूसरे समूह को निर्धारित उपचार प्राप्त होता है। यह दो स्वतंत्र नमूना समूहों का गठन करता है जो एक दूसरे के साथ अप्रभावित रहते हैं।

समान भिन्न (या पूलित) टी-टेस्ट

समान विचरण t- परीक्षण का उपयोग तब किया जाता है जब प्रत्येक समूह में नमूनों की संख्या समान होती है, या दो डेटा सेटों का विचरण समान होता है। निम्नलिखित सूत्र का उपयोग टी-मान और स्वतंत्रता की डिग्री के लिए समान भिन्नता वाले टी-टेस्ट के लिए किया जाता है:

टी-वीएएलयूई=मइएएन1-मइएएन२()एन1-1)