वर्णनात्मक आँकड़े
वर्णनात्मक आँकड़े क्या हैं?
वर्णनात्मक आँकड़े संक्षिप्त वर्णनात्मक गुणांक हैं जो किसी दिए गए डेटा सेट को संक्षेप में प्रस्तुत करते हैं, जो या तो संपूर्ण का प्रतिनिधित्व कर सकता है या किसी जनसंख्या का नमूना हो सकता है। वर्णनात्मक आँकड़े केंद्रीय प्रवृत्ति के उपायों और परिवर्तनशीलता (प्रसार) के उपायों में टूट जाते हैं। केंद्रीय प्रवृत्ति के उपायों में माध्य, मध्य और मोड शामिल हैं, जबकि परिवर्तनशीलता के उपायों में कुर्तोसिस और तिरछा शामिल हैं ।
चाबी छीन लेना
- वर्णनात्मक आँकड़े किसी डेटा सेट की विशेषताओं का सारांश या वर्णन करते हैं।
- वर्णनात्मक आंकड़ों में दो मूल श्रेणियां होती हैं: केंद्रीय प्रवृत्ति के उपाय और परिवर्तनशीलता (या प्रसार) के उपाय।
- केंद्रीय प्रवृत्ति के उपाय एक डेटा सेट के केंद्र का वर्णन करते हैं।
- परिवर्तनशीलता के उपाय या प्रसार सेट के भीतर डेटा के फैलाव का वर्णन करते हैं।
वर्णनात्मक सांख्यिकी को समझना
वर्णनात्मक आँकड़े, संक्षेप में, डेटा के नमूने और उपायों के बारे में संक्षिप्त सारांश देकर एक विशिष्ट डेटा सेट की विशेषताओं का वर्णन और समझने में मदद करते हैं। वर्णनात्मक आंकड़ों के सबसे मान्यता प्राप्त प्रकार केंद्र के उपाय हैं: माध्य, माध्य और मोड, जो गणित और सांख्यिकी के लगभग सभी स्तरों पर उपयोग किए जाते हैं। माध्य या औसत, की गणना डेटा सेट के भीतर सभी आंकड़े जोड़कर और फिर सेट के भीतर आंकड़ों की संख्या से विभाजित करके की जाती है। उदाहरण के लिए, निम्नलिखित डेटा सेट का योग 20: (2, 3, 4, 5, 6) है। माध्य 4 (20/5) है। डेटा सेट का मोड सबसे अधिक बार प्रदर्शित होने वाला मूल्य है, और माध्यिका वह डेटा सेट के बीच में स्थित आकृति है। यह डेटा सेट के भीतर निचले आंकड़ों से उच्चतर आंकड़े को अलग करने वाला आंकड़ा है। हालाँकि, कुछ सामान्य प्रकार के वर्णनात्मक आँकड़े हैं जो अभी भी बहुत महत्वपूर्ण हैं।
लोग काटने के आकार के विवरण में सेट किए गए एक बड़े डेटा में मात्रात्मक अंतर्दृष्टि को समझने के लिए वर्णनात्मक आंकड़ों का उपयोग करते हैं। एक छात्र का ग्रेड पॉइंट एवरेज (GPA), उदाहरण के लिए, वर्णनात्मक आंकड़ों की अच्छी समझ प्रदान करता है। एक GPA का विचार यह है कि यह परीक्षा, कक्षाओं, और ग्रेड की एक विस्तृत श्रृंखला से डेटा पॉइंट लेता है, और एक छात्र के समग्र शैक्षणिक प्रदर्शन की सामान्य समझ प्रदान करने के लिए उन्हें एक साथ औसत करता है। एक छात्र का व्यक्तिगत जीपीए उनके औसत शैक्षणिक प्रदर्शन को दर्शाता है।
वर्णनात्मक सांख्यिकी के उपाय
सभी वर्णनात्मक आँकड़े या तो केंद्रीय प्रवृत्ति के उपाय हैं या परिवर्तनशीलता के उपाय, जिसे फैलाव के उपाय भी कहा जाता है। केंद्रीय प्रवृत्ति के उपाय डेटा सेट के औसत या मध्य मूल्यों पर ध्यान केंद्रित करते हैं, जबकि परिवर्तनशीलता के उपाय डेटा के फैलाव पर ध्यान केंद्रित करते हैं। ये दो उपाय लोगों को विश्लेषण किए गए आंकड़ों के अर्थ को समझने में मदद करने के लिए रेखांकन, तालिकाओं और सामान्य चर्चाओं का उपयोग करते हैं।
केंद्रीय प्रवृत्ति के उपाय एक डेटा सेट के लिए वितरण की केंद्र स्थिति का वर्णन करते हैं। एक व्यक्ति वितरण में प्रत्येक डेटा बिंदु की आवृत्ति का विश्लेषण करता है और इसका मतलब, माध्यिका या मोड का उपयोग करके वर्णन करता है, जो विश्लेषण किए गए डेटा सेट के सबसे सामान्य पैटर्न को मापता है।
परिवर्तनशीलता के उपाय, या प्रसार के उपाय, विश्लेषण में सहायता करते हैं कि डेटा के एक सेट के लिए वितरण कितना फैला हुआ है। उदाहरण के लिए, जबकि केंद्रीय प्रवृत्ति के उपाय किसी व्यक्ति को डेटा सेट का औसत दे सकते हैं, यह वर्णन नहीं करता है कि डेटा सेट के भीतर कैसे वितरित किया जाता है। इसलिए जब डेटा का औसत 100 में से 65 हो सकता है, तब भी 1 और 100 दोनों पर डेटा बिंदु हो सकते हैं। परिवर्तनशीलता के उपाय डेटा सेट के आकार और प्रसार का वर्णन करके इसे संप्रेषित करने में मदद करते हैं। रेंज, चतुर्थक, पूर्ण विचलन, और विचरण सभी परिवर्तनशीलता के उपायों के उदाहरण हैं।
निम्नलिखित डेटा सेट पर विचार करें: 5, 19, 24, 62, 91, 100। उस डेटा सेट की सीमा 95 है, जिसकी गणना उच्चतम (100) से सेट किए गए डेटा में सबसे कम संख्या (5) को घटाकर की जाती है।
लगातार पूछे जाने वाले प्रश्न
हमें उन आंकड़ों की आवश्यकता क्यों है जो केवल डेटा का वर्णन करते हैं?
वर्णनात्मक आंकड़ों का उपयोग किसी नमूने या डेटा सेट की विशेषताओं का वर्णन या सारांश करने के लिए किया जाता है, जैसे कि एक चर का मतलब, मानक विचलन, या आवृत्ति। आनुमानिक आंकड़े। इस प्रकार के आँकड़े हमें डेटा नमूने के तत्वों के सामूहिक गुणों को समझने में मदद कर सकते हैं। ये उपाय हमें संभाव्यता वितरण, या डेटा के समग्र “आकार” के बारे में एक विचार दे सकते हैं , जिसे एक चार्ट जैसे हिस्टोग्राम या डॉट प्लॉट पर चित्रित किया जा सकता है। एक चर के नमूने का मतलब, विचरण और वितरण को जानने से हमें अपने आसपास की दुनिया को समझने में मदद मिल सकती है।
माध्य और मानक विचलन क्या हैं?
ये दो सामान्यतः नियोजित वर्णनात्मक आँकड़े हैं। औसत डेटा के कुछ टुकड़े में देखा गया औसत स्तर है, जबकि मानक विचलन विचरण का वर्णन करता है, या उस चर में देखे गए डेटा को इसके अर्थ के आसपास कैसे वितरित किया जाता है।
क्या वर्णनात्मक आँकड़ों का उपयोग अनुमान या भविष्यवाणी करने के लिए किया जा सकता है?
नहीं, जबकि ये विवरण डेटा की विशेषताओं को समझने में सहायक होते हैं, हीनतापूर्ण सांख्यिकीय तकनीक – आंकड़ों की एक अलग शाखा – यह समझने के लिए आवश्यक है कि डेटा सेट में चर एक दूसरे के साथ कैसे बातचीत करते हैं।