विवरण भण्डारण
डेटा भंडारण क्या है?
डेटा वेयरहाउसिंग एक व्यवसाय या संगठन द्वारा बड़ी मात्रा में जानकारी का इलेक्ट्रॉनिक भंडारण है। डेटा वेयरहाउसिंग व्यापार खुफिया का एक महत्वपूर्ण घटक है जो व्यावसायिक डेटा पर विश्लेषणात्मक तकनीकों को नियुक्त करता है।
डेटा वेयरहाउसिंग की अवधारणा को 1988 में आईबीएम के शोधकर्ताओं बैरी देवलिन और पॉल मर्फी द्वारा प्रस्तुत किया गया था । वेयरहाउस डेटा की आवश्यकता कंप्यूटर सिस्टम के रूप में विकसित हुई और डेटा की बढ़ती मात्रा को और अधिक जटिल और नियंत्रित किया गया। डेटा वेयरहाउसिंग पर एक प्रमुख पुस्तक WH Inmon की “बिल्डिंग डेटाहाउस का निर्माण” है, जिसे पहली बार 1990 में प्रकाशित किया गया था और तब से कई बार पुनर्मुद्रित किया गया है।
डेटा वेयरहाउसिंग कैसे काम करता है
डेटा वेयरहाउसिंग का उपयोग किसी विषम स्रोतों से समेकित डेटा की तुलना करके किसी कंपनी के प्रदर्शन में अधिक जानकारी प्रदान करने के लिए किया जाता है। एक डेटा वेयरहाउस को लेन-देन स्रोतों से प्राप्त ऐतिहासिक डेटा पर क्वेरी और विश्लेषण चलाने के लिए डिज़ाइन किया गया है।
एक बार जब डेटा को वेयरहाउस में शामिल कर लिया जाता है, तो यह परिवर्तित नहीं होता है और इसे बदला नहीं जा सकता क्योंकि डेटा वेयरहाउस उन घटनाओं पर विश्लेषण चलाता है जो पहले से ही समय के साथ डेटा में बदलाव पर ध्यान केंद्रित करके हुए हैं। वेयरहाउस किए गए डेटा को सुरक्षित, विश्वसनीय, पुनर्प्राप्त करने में आसान और प्रबंधित करने में आसान तरीके से संग्रहीत किया जाना चाहिए।
कुछ निश्चित चरण हैं जो डेटा वेयरहाउस बनाने के लिए उठाए जाते हैं। पहला कदम डेटा निष्कर्षण है, जिसमें कई स्रोत बिंदुओं से बड़ी मात्रा में डेटा इकट्ठा करना शामिल है। डेटा संकलित किए जाने के बाद, यह डेटा की सफाई, त्रुटियों के लिए डेटा के माध्यम से कंघी करने और पाई गई त्रुटियों को सुधारने या बाहर करने की प्रक्रिया से गुजरता है।
साफ किया गया डेटा तब डेटाबेस फॉर्मेट से वेयरहाउस फॉर्मेट में बदल जाता है। एक बार जब यह गोदाम में संग्रहीत हो जाता है, तो डेटा छँटाई, समेकन, संक्षेपण आदि से गुजरता है, ताकि यह अधिक समन्वित और उपयोग करने में आसान हो। समय के साथ, गोदाम में अधिक डेटा जोड़ा जाता है क्योंकि कई डेटा स्रोत अपडेट किए जाते हैं।
चाबी छीन लेना
- डेटा वेयरहाउसिंग एक व्यवसाय या संगठन द्वारा बड़ी मात्रा में जानकारी का इलेक्ट्रॉनिक भंडारण है।
- एक डेटा वेयरहाउस को व्यापार खुफिया और डेटा खनन उद्देश्यों के लिए लेनदेन स्रोतों से प्राप्त ऐतिहासिक डेटा पर क्वेरी और विश्लेषण चलाने के लिए डिज़ाइन किया गया है।
- डेटा वेयरहाउसिंग का उपयोग किसी विषम स्रोतों से समेकित डेटा की तुलना करके किसी कंपनी के प्रदर्शन में अधिक जानकारी प्रदान करने के लिए किया जाता है।
विशेष विचार: डाटा माइनिंग
व्यवसाय अन्वेषण और डेटा खनन में उपयोग के लिए डेटा को वेयरहाउस कर सकते हैं, सूचना के पैटर्न की तलाश कर रहे हैं जो उन्हें अपनी व्यावसायिक प्रक्रियाओं को बेहतर बनाने में मदद करेगा। एक अच्छा डेटा वेयरहाउसिंग सिस्टम एक कंपनी के भीतर विभिन्न विभागों के लिए एक-दूसरे के डेटा तक पहुंचने में आसान बना सकता है।
उदाहरण के लिए, एक डेटा वेयरहाउस किसी कंपनी को बिक्री टीम के डेटा का आसानी से आकलन करने और बिक्री में सुधार करने या विभाग को कारगर बनाने के बारे में निर्णय लेने में मदद कर सकता है। व्यवसाय अपने ग्राहकों की खर्च करने की आदतों पर ध्यान केंद्रित करके अपने उत्पादों की बेहतर स्थिति और बिक्री बढ़ाने का विकल्प चुन सकता है।
डेटा वेयरहाउसिंग के साथ, कंपनी अपने ग्राहकों के पिछले खर्चों के ऐतिहासिक डेटा को इकट्ठा कर सकती है – 20 साल – और इस डेटा पर एनालिटिक्स चला सकती है। परिणामी जानकारी अपने उपभोक्ताओं की प्राथमिकताओं में अंतर्दृष्टि प्रदान कर सकती है; अधिक बिक्री के साथ दिन, महीने या वर्ष का समय; या वर्ष के लिए सबसे अधिक खर्च करने वाला ग्राहक।
प्रभावी डेटा संग्रहण और प्रबंधन भी वही है जो प्रक्रियाएं बनाता है, जैसे यात्रा आरक्षण आरंभ करना और स्वचालित टेलर मशीनों का उपयोग संभव है।
डेटा खनन प्रक्रिया पांच चरणों में टूट जाती है:
- संगठन डेटा एकत्र करते हैं और इसे अपने डेटा वेयरहाउस में लोड करते हैं।
- फिर वे इन-हाउस सर्वर या क्लाउड पर डेटा को स्टोर और प्रबंधित करते हैं।
- व्यावसायिक विश्लेषक, प्रबंधन टीम और सूचना प्रौद्योगिकी पेशेवर डेटा तक पहुंचते हैं और निर्धारित करते हैं कि वे इसे कैसे व्यवस्थित करना चाहते हैं।
- एप्लिकेशन सॉफ़्टवेयर तब उपयोगकर्ता के परिणामों के आधार पर डेटा को सॉर्ट करता है
- अंत-उपयोगकर्ता अंत में डेटा को एक आसान-से-साझा प्रारूप में प्रस्तुत करता है, जैसे कि ग्राफ़ या तालिका।
डेटा वेयरहाउसिंग बनाम डेटाबेस
डेटा गोदाम आवश्यक रूप से मानक डेटाबेस के समान अवधारणा नहीं है। एक डेटाबेस एक ट्रांसेक्शनल सिस्टम है जो वास्तविक समय के डेटा को मॉनिटर करने और अपडेट करने के लिए सेट किया गया है ताकि केवल सबसे हाल का डेटा उपलब्ध हो सके। एक डेटा वेयरहाउस को समय-समय पर संरचित डेटा एकत्र करने के लिए प्रोग्राम किया जाता है। उदाहरण के लिए, एक डेटाबेस में केवल ग्राहक का सबसे हाल का पता हो सकता है, जबकि एक डेटा वेयरहाउस में वे सभी पते हो सकते हैं जो ग्राहक पिछले 10 वर्षों से रह रहे हैं।