बड़ा डेटा
बिग डेटा क्या है?
बिग डेटा, सूचनाओं के बड़े, विविध सेटों को संदर्भित करता है जो कभी-बढ़ती दरों पर बढ़ते हैं। इसमें सूचना, वेग या गति का आयतन शामिल होता है, जिस पर इसे बनाया जाता है और एकत्र किया जाता है, और डेटा बिंदुओं की विविधता या गुंजाइश को कवर किया जाता है (बड़े डेटा के “तीन v के रूप में जाना जाता है”)। बिग डेटा अक्सर डेटा माइनिंग से आता है और कई प्रारूपों में आता है।
चाबी छीन लेना
- बिग डेटा विभिन्न सूचनाओं की एक बड़ी मात्रा है जो बढ़ती मात्रा में और कभी-कभी उच्च वेग के साथ आता है।
- बड़े डेटा को संरचित किया जा सकता है (अक्सर संख्यात्मक, आसानी से स्वरूपित और संग्रहीत) या असंरचित (अधिक मुक्त-रूप, कम मात्रात्मक)।
- एक कंपनी में लगभग हर विभाग बड़े डेटा विश्लेषण से निष्कर्षों का उपयोग कर सकता है, लेकिन इसके अव्यवस्था और शोर को संभालने से समस्याएं पैदा हो सकती हैं।
- सामाजिक नेटवर्क और वेबसाइटों पर सार्वजनिक रूप से साझा की गई टिप्पणियों से बड़ा डेटा एकत्र किया जा सकता है, स्वैच्छिक रूप से व्यक्तिगत इलेक्ट्रॉनिक्स और ऐप से, प्रश्नावली, उत्पाद खरीद और इलेक्ट्रॉनिक चेक-इन के माध्यम से एकत्र किया जा सकता है।
- बड़े डेटा को अक्सर कंप्यूटर डेटाबेस में संग्रहीत किया जाता है और विशेष रूप से बड़े, जटिल डेटा सेट को संभालने के लिए डिज़ाइन किए गए सॉफ़्टवेयर का उपयोग करके विश्लेषण किया जाता है।
बिग डेटा कैसे काम करता है
बड़े डेटा को असंरचित या संरचित के रूप में वर्गीकृत किया जा सकता है। संरचित डेटा में पहले से ही डेटाबेस और स्प्रेडशीट में संगठन द्वारा प्रबंधित जानकारी होती है; यह प्रकृति में अक्सर संख्यात्मक होता है। असंरचित डेटा वह जानकारी है जो असंगठित है और एक पूर्व निर्धारित मॉडल या प्रारूप में नहीं आती है। इसमें सोशल मीडिया स्रोतों से एकत्र किए गए डेटा शामिल हैं, जो संस्थानों को ग्राहकों की ज़रूरतों के बारे में जानकारी इकट्ठा करने में मदद करते हैं।
सामाजिक नेटवर्क और वेबसाइटों पर सार्वजनिक रूप से साझा टिप्पणियों से बड़ा डेटा एकत्र किया जा सकता है, स्वैच्छिक रूप से व्यक्तिगत इलेक्ट्रॉनिक्स और ऐप से, प्रश्नावली, उत्पाद खरीद और इलेक्ट्रॉनिक चेक-इन के माध्यम से एकत्र किया जा सकता है। स्मार्ट उपकरणों में सेंसर और अन्य इनपुट की उपस्थिति डेटा को स्थितियों और परिस्थितियों के व्यापक स्पेक्ट्रम में इकट्ठा करने की अनुमति देती है।
बड़े डेटा को अक्सर कंप्यूटर डेटाबेस में संग्रहीत किया जाता है और विशेष रूप से बड़े, जटिल डेटा सेट को संभालने के लिए डिज़ाइन किए गए सॉफ़्टवेयर का उपयोग करके विश्लेषण किया जाता है। कई सॉफ्टवेयर-ए-इन-सर्विस (सास) कंपनियां इस प्रकार के जटिल डेटा के प्रबंधन में विशेषज्ञ हैं।
बिग डेटा का उपयोग
डेटा विश्लेषक विभिन्न प्रकार के डेटा के बीच संबंध को देखते हैं, जैसे जनसांख्यिकीय डेटा और खरीद इतिहास, यह निर्धारित करने के लिए कि क्या सहसंबंध मौजूद है। इस तरह के आकलन घर में या बाहरी रूप से तीसरे पक्ष द्वारा किए जा सकते हैं जो बड़े डेटा को पचाने योग्य प्रारूपों में प्रसंस्करण पर केंद्रित है। व्यवसाय अक्सर ऐसे विशेषज्ञों द्वारा बड़े डेटा के मूल्यांकन का उपयोग करके इसे कार्रवाई योग्य जानकारी में बदल देते हैं।
कई कंपनियां, जैसे कि अल्फाबेट और फेसबुक, सोशल मीडिया पर उपयोगकर्ताओं को लक्षित विज्ञापन देकर और वेब पर सर्फिंग करने के लिए विज्ञापन राजस्व उत्पन्न करने के लिए बड़े डेटा का उपयोग करती हैं।
एक कंपनी में लगभग हर विभाग डेटा विश्लेषण से लेकर मानव संसाधन और प्रौद्योगिकी से लेकर विपणन और बिक्री तक के निष्कर्षों का उपयोग कर सकता है । बड़े डेटा का लक्ष्य उन उत्पादों की गति को बढ़ाना है, जिन पर उत्पादों को बाज़ार में लाया जाता है, ताकि बाज़ार अपनाने, लक्षित दर्शकों को प्राप्त करने के लिए आवश्यक समय और संसाधनों की मात्रा कम हो सके और ग्राहकों को संतुष्ट रखा जा सके।
बड़े डेटा के लाभ और नुकसान
उपलब्ध आंकड़ों की मात्रा में वृद्धि दोनों अवसरों और समस्याओं को प्रस्तुत करती है। सामान्य तौर पर, ग्राहकों (और संभावित ग्राहकों) पर अधिक डेटा होने से कंपनियों को संतुष्टि और दोहराने के उच्चतम स्तर बनाने के लिए कंपनियों को बेहतर दर्जी उत्पादों और विपणन प्रयासों की अनुमति देनी चाहिए। बड़ी मात्रा में डेटा एकत्र करने वाली कंपनियों को सभी हितधारकों के लाभ के लिए गहन और समृद्ध विश्लेषण करने का अवसर प्रदान किया जाता है ।
आज व्यक्तियों पर उपलब्ध व्यक्तिगत डेटा की मात्रा के साथ, यह महत्वपूर्ण है कि कंपनियां इस डेटा की सुरक्षा के लिए कदम उठाए; एक विषय जो आज की ऑनलाइन दुनिया में एक गर्म बहस बन गया है, विशेष रूप से कई डेटा उल्लंघनों के साथ कंपनियों ने पिछले कुछ वर्षों में अनुभव किया है।
जबकि बेहतर विश्लेषण एक सकारात्मक है, बड़ा डेटा भी अधिभार और शोर पैदा कर सकता है, इसकी उपयोगिता को कम कर सकता है। कंपनियों को डेटा की बड़ी मात्रा को संभालना चाहिए और निर्धारित करना चाहिए कि शोर की तुलना में कौन सा डेटा संकेतों का प्रतिनिधित्व करता है। यह तय करना कि डेटा को प्रासंगिक बनाने का एक महत्वपूर्ण कारक है।
इसके अलावा, डेटा की प्रकृति और प्रारूप को कार्य करने से पहले विशेष हैंडलिंग की आवश्यकता हो सकती है। सांख्यिक मूल्यों से मिलकर संरचित डेटा, आसानी से संग्रहीत और सॉर्ट किया जा सकता है। ईमेल, वीडियो और टेक्स्ट डॉक्यूमेंट जैसे अनस्ट्रक्चर्ड डेटा को उपयोगी बनने से पहले और अधिक परिष्कृत तकनीकों को लागू करने की आवश्यकता हो सकती है।