प्राकृतिक भाषा प्रसंस्करण (एनएलपी) - KamilTaylan.blog
6 May 2021 0:33

प्राकृतिक भाषा प्रसंस्करण (एनएलपी)

प्राकृतिक भाषा प्रसंस्करण (एनएलपी) कृत्रिम बुद्धि का एक क्षेत्र है जो कंप्यूटर को मानव भाषा का विश्लेषण और समझने में सक्षम बनाता है। यह सॉफ्टवेयर बनाने के लिए तैयार किया गया था जो प्राकृतिक भाषाओं को उत्पन्न करता है और उनकी रचना करता है ताकि उपयोगकर्ता प्रोग्रामिंग या कृत्रिम भाषाओं जैसे जावा या सी के माध्यम से कंप्यूटर के साथ प्राकृतिक बातचीत कर सके।

प्राकृतिक भाषा प्रसंस्करण को तोड़ना (एनएलपी)

प्राकृतिक भाषा प्रसंस्करण (एनएलपी) प्रौद्योगिकी क्षेत्र के लिए एक बड़े मिशन में एक कदम है – अर्थात्, कृत्रिम बुद्धिमत्ता (एआई) का उपयोग  दुनिया के काम करने के तरीके को सरल बनाने के लिए। बहुत सारी कंपनियों के लिए डिजिटल दुनिया एक गेम-चेंजर साबित हुई है क्योंकि तेजी से बढ़ती प्रौद्योगिकी-प्रेमी आबादी एक-दूसरे के साथ और कंपनियों के साथ ऑनलाइन बातचीत करने के नए तरीके ढूंढती है। सोशल मीडिया ने समुदाय के अर्थ को फिर से परिभाषित किया है; cryptocurrency ने डिजिटल भुगतान मानदंड को बदल दिया है; ई-कॉमर्स ने शब्द सुविधा का एक नया अर्थ बनाया है, और क्लाउड स्टोरेज ने एक और स्तर की डेटा प्रतिधारण को जनता के लिए पेश किया है।

एआई के माध्यम से मशीन लर्निंग और डीप लर्निंग जैसे क्षेत्र सभी संभावनाओं की दुनिया के लिए आंखें खोल रहे हैं। बड़े डेटा की समझ बनाने के लिए डेटा एनालिटिक्स में मशीन लर्निंग का तेजी से इस्तेमाल किया जा रहा है । इसका उपयोग ग्राहकों के साथ मानवीय वार्तालाप का अनुकरण करने के लिए चैटबॉट को प्रोग्राम करने के लिए भी किया जाता है। हालाँकि, मशीन लर्निंग के ये फॉरवर्ड एप्लिकेशन नैचुरल लैंग्वेज प्रोसेसिंग (एनएलपी) के सुधार के बिना संभव नहीं होंगे।

एनएलपी वास्तव में कैसे काम करता है?

एनएलपी मानव या प्राकृतिक भाषाओं और भाषण को संसाधित करने के लिए कम्प्यूटेशनल भाषा विज्ञान और कंप्यूटर विज्ञान के साथ एआई को जोड़ती है। प्रक्रिया को तीन भागों में विभाजित किया जा सकता है। एनएलपी का पहला कार्य कंप्यूटर द्वारा प्राप्त प्राकृतिक भाषा को समझना है। कंप्यूटर एक स्पीच रिकग्निशन रूटीन को करने के लिए बिल्ट-इन स्टैटिस्टिकल मॉडल का उपयोग करता है जो प्राकृतिक भाषा को प्रोग्रामिंग लैंग्वेज में परिवर्तित करता है। यह हाल के भाषण को तोड़कर इसे छोटी इकाइयों में सुनता है, और फिर इन इकाइयों की तुलना पिछले भाषण से करता है। पाठ प्रारूप में आउटपुट या परिणाम सांख्यिकीय रूप से उन शब्दों और वाक्यों को निर्धारित करता है, जिनकी सबसे अधिक संभावना थी। इस पहले कार्य को स्पीच-टू-टेक्स्ट प्रक्रिया कहा जाता है।

अगले कार्य को पार्ट-ऑफ-स्पीच (पीओएस) टैगिंग या शब्द-श्रेणी की छूट कहा जाता है। यह प्रक्रिया उनके व्याकरणिक रूपों में संज्ञा, क्रिया, विशेषण, भूत काल, आदि जैसे शब्दों को कंप्यूटर में कोडित लिक्सिकॉन नियमों के एक सेट का उपयोग करके पहचानती है। इन दो प्रक्रियाओं के बाद, कंप्यूटर शायद अब उस भाषण का अर्थ समझता है जो बनाया गया था।

एनएलपी द्वारा लिया गया तीसरा चरण टेक्स्ट-टू-स्पीच रूपांतरण है। इस स्तर पर, कंप्यूटर प्रोग्रामिंग भाषा उपयोगकर्ता के लिए एक श्रव्य या पाठ प्रारूप में परिवर्तित हो जाती है। एक वित्तीय समाचार चैटबोट, उदाहरण के लिए, “Google आज कैसा है?” Google स्टॉक के लिए ऑनलाइन वित्त साइटों को स्कैन करने की सबसे अधिक संभावना है, और इसके उत्तर के रूप में केवल मूल्य और मात्रा जैसी जानकारी का चयन करने का निर्णय ले सकता है।

एनएलपी कंप्यूटर को बुद्धिमान बनाने का प्रयास करता है ताकि मानव यह विश्वास कर सके कि वे दूसरे मानव के साथ बातचीत कर रहे हैं। 1950 में एलन ट्यूरिंग द्वारा प्रस्तावित ट्यूरिंग टेस्ट में कहा गया है कि एक कंप्यूटर पूरी तरह से बुद्धिमान हो सकता है अगर वह मानव के बिना एक इंसान की तरह सोच सकता है और बातचीत कर सकता है कि वे वास्तव में एक मशीन के साथ बातचीत कर रहे हैं। 2014 में एक कंप्यूटर ने टेस्ट में उत्तीर्ण किया – एक 13 वर्षीय लड़के के व्यक्तित्व के साथ एक चैटबॉट। यह कहना नहीं है कि एक बुद्धिमान मशीन का निर्माण असंभव है, लेकिन यह कंप्यूटर को मानव की तरह सोचने या समझाने में निहित कठिनाइयों को रेखांकित करता है। चूँकि शब्दों का उपयोग विभिन्न संदर्भों में किया जा सकता है, और मशीनों में वास्तविक जीवन का अनुभव नहीं होता है, जिसे मनुष्य को शब्दों में व्यक्त करने और वर्णन करने के लिए होता है, दुनिया को कंप्यूटर प्रोग्रामिंग भाषा के साथ पूरी तरह से दूर होने में थोड़ा समय लग सकता है।