IJFANS International Journal of Food and Nutritional Sciences

ISSN PRINT 2319 1775 Online 2320-7876

प्राकृतिक भाषा संसाधन के विभिन्‍न अनुप्रयोगों हेतु पाइथन लाइब्रेरी का निर्माण (भारतीय भाषा/बोली के विशेष संदर्भ में)

Main Article Content

प्रवेश कुमार द्विवेदी

Abstract

वर्तमान समय में कृत्रिम बुद्धि के विस्तार हेतु प्राकृतिक भाषा संसाधन के भाषिक अनुप्रयोग अपनी केंद्रीय भूमिका निभा रहे हैं। स्वस्थ्य भाषिक प्रणाली के निर्माण कार्य हेतु पाइथन प्रोग्रामिंग भाषा एक शक्तिशाली एवं महत्वपूर्ण प्रोग्रामिंग भाषा के तौर पर उभरकर सामने आई है। इसका कारण एक यह भी है कि भाषिक अनुप्रयोग के एल्गोरिथम को अनुप्रयुक्त करने हेतु विभिन्न प्रकार की कई लाइब्रेरी का निर्माण किया जा चुका है अथवा किया भी जा रहा है। इन लाइब्रेरी की सहायता से बड़ी ही सहजता व सरलता के साथ विभिन्न भाषिक अनुप्रयोग का निर्माण किया जा सकता है। इसी तारतम्य में भारतीय भाषा हेतु भाषिक अनुप्रयोग के निर्माण हेतु एक आवश्यक पाइथन लाइब्रेरी का निर्माण किया जाएगा, जिसकी सहायता से हिंदी के साथ साथ अन्य भारतीय भाषा व बोलियां भी अपनी जगह तकनीकी में बना सकें एवं इनका भी साहित्य समृद्ध हो सके। इस लाइब्रेरी के निर्माण हेतु मशीन लर्निंग (Supervised), डीप लर्निंग (recurrent neural network) एवं भाषा वैज्ञानिक नियमों (Linguistic rules) के एल्गोरिथम का समावेशन किया जाएगा। प्रस्तुत शोध पत्र के अंतर्गत यह स्पष्ट किया गया है कि भारतीय भाषा को तकनीकी में अनुप्रयुक्त करने हेतु एक पाइथन लाइब्रेरी की अत्यंत आवश्यकता महसूस की जा रही है। जिसकी सहायता से हिंदी एवं अन्य भारतीय भाषा (संकटग्रस्त भाषा सहित) को तकनीकी में प्रयुक्त किया जा सके। भारतीय भाषा हेतु अभी तक ऐसी लाइब्रेरी बहुत ही कम हैं। अभी तक की जो प्राकृतिक भाषा संसाधन हेतु निर्मित की गई सामान्य पाइथन लाइब्रेरी उपलब्ध हैं, वे निम्न प्रकार से हैं:

Article Details