वर्गों का योग
वर्गों का योग क्या है?
वर्गों का योग डेटा बिंदुओं के फैलाव को निर्धारित करने के लिए प्रतिगमन विश्लेषण में उपयोग की जाने वाली एक सांख्यिकीय तकनीक है। एक प्रतिगमन विश्लेषण में, लक्ष्य यह निर्धारित करना है कि डेटा श्रृंखला को एक फ़ंक्शन से कितनी अच्छी तरह फिट किया जा सकता है जो यह बताने में मदद कर सकता है कि डेटा श्रृंखला कैसे उत्पन्न हुई थी। वर्गों का योग एक गणितीय तरीके के रूप में उपयोग किया जाता है जो फ़ंक्शन को खोजने के लिए डेटा से सबसे अच्छा फिट बैठता है (कम से कम भिन्न होता है)।
चौकों के योग के लिए सूत्र है
वर्गों के योग को भिन्नता के रूप में भी जाना जाता है।
वर्गों का योग आपको क्या बताता है?
वर्गों का योग माध्य से विचलन का माप है। आंकड़ों में, माध्य संख्याओं के एक सेट का औसत है और केंद्रीय प्रवृत्ति का सबसे अधिक इस्तेमाल किया जाने वाला उपाय है । अंकगणितीय माध्य को केवल डेटा सेट में मानों की संख्या और मूल्यों की संख्या से विभाजित करके गणना की जाती है।
बता दें कि पिछले पांच दिनों में Microsoft (MSFT) की बंद कीमतें अमेरिकी डॉलर में 74.01, 74.77, 73.94, 73.61 और 73.40 थीं। कुल कीमतों का योग $ 369.73 है और पाठ्यपुस्तक का औसत या औसत मूल्य इस प्रकार $ 369.73 / 5 = $ 73.95 होगा।
लेकिन माप सेट का मतलब जानना हमेशा पर्याप्त नहीं होता है। कभी-कभी, यह जानना उपयोगी होता है कि माप के एक सेट में कितनी भिन्नता है। अलग-अलग मूल्य इस अर्थ से अलग हैं कि अवलोकन या मूल्यों को बनाए गए प्रतिगमन मॉडल के लिए कितने फिट हैं, इस बारे में कुछ जानकारी दे सकते हैं ।
उदाहरण के लिए, यदि कोई विश्लेषक जानना चाहता था कि क्या MSFT का शेयर मूल्य Apple (AAPL) की कीमत के साथ मिलकर चलता है, तो वह एक निश्चित अवधि के लिए दोनों शेयरों की प्रक्रिया के लिए टिप्पणियों के सेट को सूचीबद्ध कर सकता है, 1, 2, या 10 साल और रिकॉर्ड किए गए प्रत्येक अवलोकन या माप के साथ एक रैखिक मॉडल बनाएं । यदि दोनों चर (यानी, AAPL की कीमत और MSFT की कीमत) के बीच संबंध एक सीधी रेखा नहीं है, तो डेटा सेट में भिन्नताएं हैं जिन्हें जांचने की आवश्यकता है।
आंकड़ों में बोलते हैं, अगर बनाए गए रैखिक मॉडल में रेखा मूल्य के सभी माप से नहीं गुजरती है, तो कुछ परिवर्तनशीलता जो शेयर की कीमतों में देखी गई है, अस्पष्टीकृत है। वर्गों के योग का उपयोग यह गणना करने के लिए किया जाता है कि क्या एक रैखिक संबंध दो चर के बीच मौजूद है, और किसी अस्पष्टीकृत परिवर्तनशीलता को वर्गों के अवशिष्ट योग के रूप में संदर्भित किया जाता है ।
वर्गों का योग भिन्नता के वर्ग का योग है, जहाँ भिन्नता को प्रत्येक व्यक्ति के मान और माध्य के बीच प्रसार के रूप में परिभाषित किया जाता है। वर्गों के योग का निर्धारण करने के लिए, प्रत्येक डेटा बिंदु और सबसे अच्छी रेखा के बीच की दूरी को चुकता किया जाता है और फिर सारांशित किया जाता है। सबसे अच्छा फिट की लाइन इस मूल्य को कम करेगी।
वर्गों के योग की गणना कैसे करें
अब आप देख सकते हैं कि माप को वर्ग विचलन का योग क्यों कहा जाता है, या छोटे के लिए वर्गों का योग। ऊपर हमारे MSFT उदाहरण का उपयोग करके, वर्गों की राशि की गणना इस प्रकार की जा सकती है:
- SS = (74.01 – 73.95) 2 + (74.77 – 73.95) 2 + (73.94 – 73.95) 2 + (73.61 – 73.95) 2 + (73.40 – 73.95) 2
- एसएस = (0.06) 2 + (0.82) 2 + (-0.01) 2 + (-0.34) 2 + ( -05-5 ) 2
- एसएस = 1.0942
बिना विचलन के अकेले विचलन के योग को जोड़ने के परिणामस्वरूप या शून्य के बराबर संख्या होगी क्योंकि नकारात्मक विचलन लगभग पूरी तरह से सकारात्मक विचलन को ऑफसेट करेंगे। अधिक यथार्थवादी संख्या प्राप्त करने के लिए, विचलन का योग चुकाना होगा। वर्गों का योग हमेशा एक धनात्मक संख्या होगा क्योंकि किसी भी संख्या का वर्ग, चाहे वह धनात्मक या ऋणात्मक हो, हमेशा धनात्मक होता है।
चौकों के योग का उपयोग कैसे करें इसका उदाहरण
MSFT गणना के परिणामों के आधार पर, वर्गों का एक उच्च योग इंगित करता है कि अधिकांश मान क्षुद्र से दूर हैं, और इसलिए, डेटा में बड़ी परिवर्तनशीलता है। वर्गों का कम योग टिप्पणियों के सेट में कम परिवर्तनशीलता को संदर्भित करता है।
ऊपर दिए गए उदाहरण में, 1.0942 से पता चलता है कि पिछले पांच दिनों में MSFT के शेयर की कीमत में परिवर्तनशीलता बहुत कम है और निवेशक मूल्य स्थिरता और कम अस्थिरता वाले शेयरों में निवेश करना चाह रहे हैं जो MSFT का विकल्प चुन सकते हैं।
चाबी छीन लेना
- वर्गों का योग माध्य मान से दूर डेटा बिंदुओं के विचलन को मापता है।
- एक उच्च राशि-वर्ग परिणाम डेटा सेट के भीतर परिवर्तनशीलता की एक बड़ी डिग्री को इंगित करता है, जबकि एक कम परिणाम इंगित करता है कि डेटा औसत मूल्य से काफी भिन्न नहीं होता है।
वर्गों के योग का उपयोग करने की सीमाएं
किस शेयर को खरीदने के लिए निवेश का निर्णय लेना यहाँ सूचीबद्ध लोगों की तुलना में कई अधिक टिप्पणियों की आवश्यकता है। एक विश्लेषक को किसी उच्च निश्चितता के साथ यह जानने के लिए डेटा के वर्षों के साथ काम करना पड़ सकता है कि किसी संपत्ति की परिवर्तनशीलता कितनी कम या कम है। जैसे-जैसे सेट में अधिक डेटा बिंदु जोड़े जाएंगे, वर्गों का योग बड़ा होता जाएगा क्योंकि मान अधिक फैल जाएंगे।
भिन्नता के सबसे व्यापक रूप से उपयोग किए जाने वाले माप मानक विचलन और विचरण हैं । हालाँकि, दोनों में से किसी एक मैट्रिक्स की गणना करने के लिए, वर्गों के योग की गणना सबसे पहले की जानी चाहिए। विचरण वर्गों के योग का औसत है (यानी, टिप्पणियों की संख्या से विभाजित वर्गों का योग)। मानक विचलन विचरण का वर्गमूल है।
प्रतिगमन विश्लेषण के दो तरीके हैं जो वर्गों के योग का उपयोग करते हैं: रैखिक न्यूनतम वर्ग विधि और गैर-रैखिक न्यूनतम वर्ग विधि। सबसे कम वर्ग विधि इस तथ्य को संदर्भित करती है कि प्रतिगमन फ़ंक्शन वास्तविक डेटा बिंदुओं से विचरण के वर्गों के योग को कम करता है। इस तरह, एक फ़ंक्शन खींचना संभव है जो सांख्यिकीय रूप से डेटा के लिए सबसे अच्छा फिट प्रदान करता है। ध्यान दें कि एक प्रतिगमन फ़ंक्शन रैखिक (एक सीधी रेखा) या गैर-रैखिक (एक वक्र रेखा) हो सकता है।