डेटा खनन
डाटा माइनिंग क्या है?
डेटा माइनिंग कंपनियों द्वारा कच्चे डेटा को उपयोगी जानकारी में बदलने के लिए इस्तेमाल की जाने वाली प्रक्रिया है। डेटा के बड़े बैचों में पैटर्न देखने के लिए सॉफ़्टवेयर का उपयोग करके, व्यवसाय अपने ग्राहकों के बारे में अधिक प्रभावी विपणन रणनीतियों को विकसित करने, बिक्री बढ़ाने और लागत में कमी के बारे में अधिक जान सकते हैं। डेटा माइनिंग प्रभावी डेटा संग्रह, वेयरहाउसिंग और कंप्यूटर प्रोसेसिंग पर निर्भर करता है ।
डेटा माइनिंग प्रक्रियाओं का उपयोग मशीन लर्निंग मॉडल बनाने के लिए किया जाता है जो कि खोज इंजन प्रौद्योगिकी और वेबसाइट सिफारिश कार्यक्रमों सहित बिजली अनुप्रयोगों।
डाटा माइनिंग कैसे काम करता है
डेटा माइनिंग में अर्थपूर्ण पैटर्न और रुझानों को चमकाने के लिए सूचना के बड़े ब्लॉक की खोज और विश्लेषण करना शामिल है। इसका उपयोग कई प्रकार से किया जा सकता है, जैसे कि डेटाबेस मार्केटिंग, क्रेडिट रिस्क मैनेजमेंट, फ्रॉड डिटेक्शन, स्पैम ईमेल फ़िल्टरिंग या यहां तक कि उपयोगकर्ताओं की भावना या राय को समझने के लिए भी।
डेटा माइनिंग प्रक्रिया पांच चरणों में टूट जाती है। सबसे पहले, संगठन डेटा एकत्र करते हैं और इसे अपने डेटा वेयरहाउस में लोड करते हैं। इसके बाद, वे डेटा को स्टोर करते हैं और इन-हाउस सर्वर या क्लाउड पर प्रबंधित करते हैं। व्यावसायिक विश्लेषक, प्रबंधन टीम और सूचना प्रौद्योगिकी पेशेवर डेटा तक पहुंचते हैं और निर्धारित करते हैं कि वे इसे कैसे व्यवस्थित करना चाहते हैं। फिर, एप्लिकेशन सॉफ़्टवेयर उपयोगकर्ता के परिणामों के आधार पर डेटा को सॉर्ट करता है, और अंत में, एंड-यूज़र डेटा को एक आसान-से-शेयर प्रारूप में प्रस्तुत करता है, जैसे कि ग्राफ़ या तालिका।
डाटा वेयरहाउसिंग और माइनिंग सॉफ्टवेयर
डेटा माइनिंग प्रोग्राम उपयोगकर्ताओं के अनुरोध के आधार पर डेटा में रिश्तों और पैटर्न का विश्लेषण करते हैं। उदाहरण के लिए, एक कंपनी सूचना के वर्ग बनाने के लिए डेटा माइनिंग सॉफ़्टवेयर का उपयोग कर सकती है। वर्णन करने के लिए, एक रेस्तरां की कल्पना करें कि यह निर्धारित करने के लिए डेटा खनन का उपयोग करना चाहता है कि उसे कब कुछ विशेष प्रदान करना चाहिए। यह उस जानकारी को देखता है जो उसने एकत्र की है और ग्राहकों के जाने और वे क्या आदेश देते हैं, इसके आधार पर कक्षाएं बनाता है।
अन्य मामलों में, डेटा खनिक तार्किक संबंधों के आधार पर जानकारी के समूहों को ढूंढते हैं या उपभोक्ता व्यवहार में रुझान के बारे में निष्कर्ष निकालने के लिए संघों और अनुक्रमिक पैटर्न को देखते हैं।
वेयरहाउसिंग डेटा माइनिंग का एक महत्वपूर्ण पहलू है। वेयरहाउसिंग तब होता है जब कंपनियां अपने डेटा को एक डेटाबेस या प्रोग्राम में केंद्रीकृत करती हैं। डेटा वेयरहाउस के साथ, एक संगठन विशिष्ट उपयोगकर्ताओं के विश्लेषण और उपयोग के लिए डेटा के सेगमेंट को बंद कर सकता है।
हालांकि, अन्य मामलों में, विश्लेषक उन आंकड़ों के साथ शुरू कर सकते हैं जो वे चाहते हैं और उन चश्मे के आधार पर डेटा वेयरहाउस बना सकते हैं । भले ही व्यवसाय और अन्य संस्थाएं अपने डेटा को कैसे व्यवस्थित करें, वे इसका उपयोग प्रबंधन की निर्णय लेने की प्रक्रियाओं का समर्थन करने के लिए करते हैं।
डाटा माइनिंग का उदाहरण
किराना स्टोर डेटा माइनिंग तकनीकों के प्रसिद्ध उपयोगकर्ता हैं। कई सुपरमार्केट ग्राहकों को मुफ्त लॉयल्टी कार्ड प्रदान करते हैं जो उन्हें गैर-सदस्यों को उपलब्ध कम कीमतों तक पहुंच प्रदान करते हैं। कार्ड स्टोर के लिए यह ट्रैक करना आसान बनाते हैं कि कौन क्या खरीद रहा है, जब वे इसे खरीद रहे हैं और किस कीमत पर। डेटा का विश्लेषण करने के बाद, स्टोर फिर इस डेटा का उपयोग ग्राहकों को उनकी खरीद की आदतों को लक्षित कूपन की पेशकश करने के लिए कर सकते हैं और यह तय कर सकते हैं कि वस्तुओं को बिक्री पर रखा जाए या उन्हें पूरी कीमत पर कब बेचा जाए।
डेटा खनन एक चिंता का कारण हो सकता है जब कोई कंपनी केवल चयनित जानकारी का उपयोग करती है, जो एक निश्चित परिकल्पना को साबित करने के लिए समग्र नमूना समूह का प्रतिनिधि नहीं है।
चाबी छीन लेना
- डाटा माइनिंग, सूचनाओं के एक बड़े बैच का विश्लेषण करने की प्रक्रिया है।
- डेटा माइनिंग का उपयोग निगमों द्वारा उन सभी चीज़ों के बारे में जानने के लिए किया जा सकता है, जिनसे ग्राहक रुचि रखते हैं या धोखाधड़ी का पता लगाने और स्पैम फ़िल्टरिंग के लिए खरीदना चाहते हैं।
- डेटा माइनिंग प्रोग्राम डेटा में उन पैटर्नों और कनेक्शनों को तोड़ते हैं, जो सूचना उपयोगकर्ताओं के अनुरोध या प्रदान के आधार पर होते हैं।