5 May 2021 14:35

बड़ा डेटा

बिग डेटा क्या है?

बिग डेटा, सूचनाओं के बड़े, विविध सेटों को संदर्भित करता है जो कभी-बढ़ती दरों पर बढ़ते हैं। इसमें सूचना, वेग या गति का आयतन शामिल होता है, जिस पर इसे बनाया जाता है और एकत्र किया जाता है, और डेटा बिंदुओं की विविधता या गुंजाइश को कवर किया जाता है (बड़े डेटा के “तीन v के रूप में जाना जाता है”)। बिग डेटा अक्सर डेटा माइनिंग से आता है और कई प्रारूपों में आता है।

चाबी छीन लेना

  • बिग डेटा विभिन्न सूचनाओं की एक बड़ी मात्रा है जो बढ़ती मात्रा में और कभी-कभी उच्च वेग के साथ आता है।
  • बड़े डेटा को संरचित किया जा सकता है (अक्सर संख्यात्मक, आसानी से स्वरूपित और संग्रहीत) या असंरचित (अधिक मुक्त-रूप, कम मात्रात्मक)।
  • एक कंपनी में लगभग हर विभाग बड़े डेटा विश्लेषण से निष्कर्षों का उपयोग कर सकता है, लेकिन इसके अव्यवस्था और शोर को संभालने से समस्याएं पैदा हो सकती हैं।
  • सामाजिक नेटवर्क और वेबसाइटों पर सार्वजनिक रूप से साझा की गई टिप्पणियों से बड़ा डेटा एकत्र किया जा सकता है, स्वैच्छिक रूप से व्यक्तिगत इलेक्ट्रॉनिक्स और ऐप से, प्रश्नावली, उत्पाद खरीद और इलेक्ट्रॉनिक चेक-इन के माध्यम से एकत्र किया जा सकता है।
  • बड़े डेटा को अक्सर कंप्यूटर डेटाबेस में संग्रहीत किया जाता है और विशेष रूप से बड़े, जटिल डेटा सेट को संभालने के लिए डिज़ाइन किए गए सॉफ़्टवेयर का उपयोग करके विश्लेषण किया जाता है।

बिग डेटा कैसे काम करता है

बड़े डेटा को असंरचित या संरचित के रूप में वर्गीकृत किया जा सकता है। संरचित डेटा में पहले से ही डेटाबेस और स्प्रेडशीट में संगठन द्वारा प्रबंधित जानकारी होती है; यह प्रकृति में अक्सर संख्यात्मक होता है। असंरचित डेटा वह जानकारी है जो असंगठित है और एक पूर्व निर्धारित मॉडल या प्रारूप में नहीं आती है। इसमें सोशल मीडिया स्रोतों से एकत्र किए गए डेटा शामिल हैं, जो संस्थानों को ग्राहकों की ज़रूरतों के बारे में जानकारी इकट्ठा करने में मदद करते हैं।

सामाजिक नेटवर्क और वेबसाइटों पर सार्वजनिक रूप से साझा टिप्पणियों से बड़ा डेटा एकत्र किया जा सकता है, स्वैच्छिक रूप से व्यक्तिगत इलेक्ट्रॉनिक्स और ऐप से, प्रश्नावली, उत्पाद खरीद और इलेक्ट्रॉनिक चेक-इन के माध्यम से एकत्र किया जा सकता है। स्मार्ट उपकरणों में सेंसर और अन्य इनपुट की उपस्थिति डेटा को स्थितियों और परिस्थितियों के व्यापक स्पेक्ट्रम में इकट्ठा करने की अनुमति देती है।

बड़े डेटा को अक्सर कंप्यूटर डेटाबेस में संग्रहीत किया जाता है और विशेष रूप से बड़े, जटिल डेटा सेट को संभालने के लिए डिज़ाइन किए गए सॉफ़्टवेयर का उपयोग करके विश्लेषण किया जाता है। कई सॉफ्टवेयर-ए-इन-सर्विस (सास) कंपनियां इस प्रकार के जटिल डेटा के प्रबंधन में विशेषज्ञ हैं।

बिग डेटा का उपयोग

डेटा विश्लेषक विभिन्न प्रकार के डेटा के बीच संबंध को देखते हैं, जैसे जनसांख्यिकीय डेटा और खरीद इतिहास, यह निर्धारित करने के लिए कि क्या सहसंबंध मौजूद है। इस तरह के आकलन घर में या बाहरी रूप से तीसरे पक्ष द्वारा किए जा सकते हैं जो बड़े डेटा को पचाने योग्य प्रारूपों में प्रसंस्करण पर केंद्रित है। व्यवसाय अक्सर ऐसे विशेषज्ञों द्वारा बड़े डेटा के मूल्यांकन का उपयोग करके इसे कार्रवाई योग्य जानकारी में बदल देते हैं।



कई कंपनियां, जैसे कि अल्फाबेट और फेसबुक, सोशल मीडिया पर उपयोगकर्ताओं को लक्षित विज्ञापन देकर और वेब पर सर्फिंग करने के लिए विज्ञापन राजस्व उत्पन्न करने के लिए बड़े डेटा का उपयोग करती हैं।

एक कंपनी में लगभग हर विभाग डेटा विश्लेषण से लेकर मानव संसाधन और प्रौद्योगिकी से लेकर विपणन और बिक्री तक के निष्कर्षों का उपयोग कर सकता है । बड़े डेटा का लक्ष्य उन उत्पादों की गति को बढ़ाना है, जिन पर उत्पादों को बाज़ार में लाया जाता है, ताकि बाज़ार अपनाने, लक्षित दर्शकों को प्राप्त करने के लिए आवश्यक समय और संसाधनों की मात्रा कम हो सके और ग्राहकों को संतुष्ट रखा जा सके।

बड़े डेटा के लाभ और नुकसान

उपलब्ध आंकड़ों की मात्रा में वृद्धि दोनों अवसरों और समस्याओं को प्रस्तुत करती है। सामान्य तौर पर, ग्राहकों (और संभावित ग्राहकों) पर अधिक डेटा होने से कंपनियों को संतुष्टि और दोहराने के उच्चतम स्तर बनाने के लिए कंपनियों को बेहतर दर्जी उत्पादों और विपणन प्रयासों की अनुमति देनी चाहिए। बड़ी मात्रा में डेटा एकत्र करने वाली कंपनियों को सभी हितधारकों के लाभ के लिए गहन और समृद्ध विश्लेषण करने का अवसर प्रदान किया जाता है ।



आज व्यक्तियों पर उपलब्ध व्यक्तिगत डेटा की मात्रा के साथ, यह महत्वपूर्ण है कि कंपनियां इस डेटा की सुरक्षा के लिए कदम उठाए; एक विषय जो आज की ऑनलाइन दुनिया में एक गर्म बहस बन गया है, विशेष रूप से कई डेटा उल्लंघनों के साथ कंपनियों ने पिछले कुछ वर्षों में अनुभव किया है।

जबकि बेहतर विश्लेषण एक सकारात्मक है, बड़ा डेटा भी अधिभार और शोर पैदा कर सकता है, इसकी उपयोगिता को कम कर सकता है। कंपनियों को डेटा की बड़ी मात्रा को संभालना चाहिए और निर्धारित करना चाहिए कि शोर की तुलना में कौन सा डेटा संकेतों का प्रतिनिधित्व करता है। यह तय करना कि डेटा को प्रासंगिक बनाने का एक महत्वपूर्ण कारक है।

इसके अलावा, डेटा की प्रकृति और प्रारूप को कार्य करने से पहले विशेष हैंडलिंग की आवश्यकता हो सकती है। सांख्यिक मूल्यों से मिलकर संरचित डेटा, आसानी से संग्रहीत और सॉर्ट किया जा सकता है। ईमेल, वीडियो और टेक्स्ट डॉक्यूमेंट जैसे अनस्ट्रक्चर्ड डेटा को उपयोगी बनने से पहले और अधिक परिष्कृत तकनीकों को लागू करने की आवश्यकता हो सकती है।