Quantcast
Channel: विचार – Sajha Post
Viewing all articles
Browse latest Browse all 942

नेपालमा भाषा कम्प्युटिङ र कल्पनाको लड्डू

$
0
0

नेपालमा भाषा कम्प्युटिङको कुरा र मनको लड्डु घिउसँग खाने कुरा उस्तै-उस्तै हुन् । मनको लड्डु घिउसँग खाने कुराको त परिभाषा गरिरहन पर्दैन । तर, भाषा कम्प्युटिङलाई कसरी परिभाषित गर्ने वा भाषा कम्प्युटिङ भनेको केहो भनेर केही ब्याख्या गर्नैपर्ने हुन्छ । भाषा कम्प्युटिङ भनेको विद्युतीय मेसिन वा मेसिन प्रविधिको माध्यमबाट भाषा र व्याकरण विश्लेषण गर्ने र कृत्रिम बुद्धिका सहायताले सूचना प्रविधिमा स्वचालितरूपमा भाषाको प्रयोग गर्ने प्रविधिलाई भाषा इन्जिनियरिङ वा भाषा प्रविधि भन्ने गरिन्छ ।

प्राकृतिक भाषा अध्याहार (नेचुरल ल्याङ्ग्वेज प्रोसेसिङ) को क्षेत्र भनेको भाषाको विद्युतीय विश्लेषणको क्षेत्र हो । प्राकृतिक भाषा अध्याहारको विश्लेषण प्रयोजनका लागि कृत्रिम बुद्धिको आवश्यकता पर्छ जसलाई अङ्ग्रेजी भाषामा आर्टिफिसियल इन्टेलिजेन्स भनिन्छ । यही कृत्रिम बुद्धिका सहायताले कम्प्युटरले प्राकृतिक भाषा बुझ्दछ । यसलाई नै अङ्ग्रेजीमा प्राकृतिक भाषा अध्याहार (नेचुरल ल्याङ्ग्वेज प्रोसेसिङ वा एनएलपी) का नामले चिनिन्छ । प्राकृतिक भाषा अध्याहार निश्चित मूल्य र मानकमा आधारित हुन्छ । कम्प्युटरले मानवले जस्तै भाषा अध्याहार गर्न सक्ने कार्यलाई प्राकृतिक भाषा अध्याहारको लक्ष्यका रूपमा लिने गरिन्छ । त्यसैले प्राकृतिक भाषा अध्याहारका लागि कुन भाषाको अध्याहार गरिने हो त्यस भाषाको सार्वभौम वर्ण सङ्केतन पद्धति निर्धारण गर्नु सबभन्दा पहिलो काम हो । नेपालमा भाषा इन्जिनियरिङको सुरुआत भई नसकेतापनि समयक्रमसँगै यसबारे प्रविधि अध्येता र सरकारको ध्यान जाला भन्ने कुरामा आस चाहिँ राख्नै पर्छ । सरकार, देशका जिम्मेवार शैक्षिक संस्था, नास्ट, नेपाल प्रज्ञा प्रतिष्ठान जस्ता संस्थाको आँखामा मोतिविन्दु लागेको अहिलेको बेलामा पर्खिनु सिवाय केही गरिहाल्ने वा यसबारे कसैले सुनीदेला भन्ने अवस्था छैन ।

डा. लक्ष्मीप्रसाद खतिवडा

स्थानीयकरण (लोकलाइजेसन) को बढ्दो विश्वव्यापी प्रभावलाई मानकीकरण गर्दै भाषाको जटिलता हटाउने उद्देश्यले नेपालमा पनि सूचना प्रविधि उच्चस्तरीय आयोग अन्तर्गत सूचना प्रविधिमा नेपालका भाषाहरू (एनएलआइटी) को स्थापना भएको थियो । नेपालमा कम्प्युटरको व्यवसायिक प्रयोगको सुरुआत राष्ट्रिय जनगणनाबाट थालनी भएको पाइन्छ । मेनफ्रेम कम्प्युटर भाडामा ल्याएर कम्प्युटरबाट सूचना भण्डारण र प्रशोधनको काम गर्न थालेको तीन दशक नाघिसक्यो । मेनफ्रेम, मिनिफ्रेम, डेस्कटप कम्युटर, काखे (ल्यापटप) कम्प्युटर र मोबाइल कम्प्युटिङसम्मको यात्रामा प्रविधिका क्षेत्रमा महत्वपूर्ण मानकहरूको निर्माण भइसक्नु पर्ने हो । तर सूचना प्रविधिको काम अङ्रेजी भाषाका माध्यमबाट मात्र हुने गरेकाले साधारण जनतामा कम्प्युटर हाम्रा लागि बनेको होइन भन्ने धारणाले जरो गाड्यो ।

कम्प्युटर प्रविधिमा धरै लामो समयसम्म एउटा एकलकाँटे सोचाइले जरा गाड्यो । त्यो के भने ‘कम्प्युटरको मातृ भाषा भनेको अङ्ग्रेजी भाषा हो’ । यही सोचाइका बलले कम्प्युटर ब्यवसायका क्षेत्रमा बिल गेट्स जस्ता महासम्राटहरूको जन्म पनि भयो ।

एकातिर साधारण जनतामा प्रविधिप्रतिको बेवास्ता वा यो हाम्रालागि होइन भन्ने छाप कायमै रह्यो भने अर्कातिर कम्प्युटर विशेष प्राविधिक काम बढी हुने सङ्घसंस्थामा मात्र प्रयोग हुने हुनाले सूचना प्रविधिमा स्थानीय भाषाको पहुँच आम जनतासम्म पुर्‍याउने कुरामा सरकारी वा व्यक्तिगत तवरबाट पनि सोचाइ नै रहेन । कम्प्युटर प्रविधिमा धरै लामो समयसम्म एउटा एकलकाँटे सोचाइले जरा गाड्यो । त्यो के भने ‘कम्प्युटरको मातृ भाषा भनेको अङ्ग्रेजी भाषा हो’ । यही सोचाइका बलले कम्प्युटर ब्यवसायका क्षेत्रमा बिल गेट्स जस्ता महासम्राटहरूको जन्म पनि भयो ।

हामीकहाँ कम्प्युटर सञ्चालनको सक्कली संस्करण (भर्सन) समेत चलाउने परिपाटी छैन । यसको विकल्प सोच्नुभन्दा यही प्रविधिको लाइसेन्स नम्बरको अवैधानिक नक्कल गरी पाइरेटेड सफ्टवेयरका रूपमा प्रयोग गर्ने परिपाटी मौलाउन थाल्यो । सक्नेले सक्कली सफ्टवेयर किनेर चलाउने र आम प्रोयोगकर्ताले पाइरेटेड सफ्टवेयरनै चलाउने परिपाटी धेरै लामो समयसम्म रहिरह्यो । वर्तमान समयमा पनि हुने र सक्नेले मात्र सक्कली सफ्टवेयर चलाउँछन् र अधिकांश तल्लो तहका सरकारी कार्यालय र सर्वसाधारणले त पाइरेटेड सफ्टवेयरनै चलाउने गर्छन् ।

सन् ८० को दशकमा छिटफुट रूपमा र ९० को दशकमा योजनाबद्ध रूपमा लिनक्स सञ्चालन प्रविधिमार्फत खुला स्रोत सफ्टवेयरको विकास हुन थालेपछि माइक्रोसफ्टको पाइरेटेड सफ्टवेयरका अलावा खुला स्रोत सफ्टवेयरको प्रचलन आउन थालेको हो तर पनि सामान्य जनमानससम्म पुग्न सकेको छैन । उम्दाखालका कम्प्युटर इन्जिनियरहरूले भने लिनक्समा रुची राख्न थालेको अवस्था छ । जसले गर्दा अङ्ग्रेजीभन्दा अन्य भाषामा पनि अङ्ग्रेजीमा जस्तै समानान्तर रूपमा कम्प्युटर चलाउन सकिन्छ भन्ने सोच पलाउन थाल्यो ।
अङ्ग्रेजी कम्प्युटरको मातृभाषा हो भन्ने दूषित धारणालाई पखाल्न यसले ठूलो मद्दत पुर्‍यायो ।

देशमा छुवाछुतको भेदभाव त हटिसक्यो तर कम्प्युटर प्रविधिमा अझै बाँकी रहेछ । कम्प्युटर प्रविधिमा यस्तो आमधारणा रहेसम्म भाषा कम्प्युटिङको त के कुरा नेपालीमा टाइप गरेको कुरा विदेशमा वा दूरदराजको कुनै ठाउँमा बसेर हेर्नु पर्‍यो भने यो वा त्यो फन्ट चाहिने रोगले छाड्दैन ।

विश्वव्यापी एकीकृत सङ्केतन प्रणाली (युनिकोड) को विकासपछि नेपालमा पनि देवनागरी युनिकोडको निर्माण गरी सूचना प्रविधिमा नेपाली भषालाई भित्र्याउने काम सुरु भयो । खुलास्रोत सफ्टवेयर प्रणालीमा आधारित लिनक्स प्रविधिअन्तर्गत मदन पुरसकार पुस्तकालयले नेपाली भाषाकै माध्यमबाट कम्प्युटर सञ्चालन प्रणालीको विकास गर्‍यो भने अनलिमिटेड नुमिडिया प्रालिले नेपाली भाषाका माध्यमबाट माइक्रोसफ्ट अफिस प्रणालीको विकास गर्‍यो । नेपालमा भाषा कम्प्युटिङको आधार वा स्थानीयकरणको ऐतिहासिक विकास यसरी भएको देखिन्छ । तर अन्तर्राट्रिय मानक सङ्गठनसँग सहकार्यका अभावमा नेपाली कम्प्युटिङ कार्य अगाडि बढ्न सकेन ।

हाल नेपालमा सूचना प्रविधिका क्षेत्रमा धेरै ठूला ठूला काम उदाहरणका लागि इ-सरकार, इ-प्रशासन, इ-कानुन, इ-दूरकेन्द्र, इ-शिक्ष र सन्सारको सूचना प्रविधिसँग सीधा सम्पर्क जोड्ने डाटाकेन्द्रको निर्माणजस्ता काममा सरकारले विशेष ध्यान दिइरहेको भनिएको छ तर साना साना कुरा गर्न भने बाँकी नै छ । कुञ्जीपाटी (किबोर्ड) मानकीकरण, इनपुट (प्रविष्टि) मानकीकरण, लगत (डाटा) सङ्केतन मानकीकरण, पुरानो लगत (डाटा) रुपान्तर प्रकृयाजस्ता साना तर आधारभूत कुरा भने केही पनि भएको छैन । भब्य महल बनाउने काम भइरहेको छ तर सतहमाथि पर्खाल उठाएर । जग हाल्न र पिलर गाड्न चाही बाँकी नै छ ।

भाषा कम्युटिङको कुरा गर्दा प्रविष्टि (इनपुट) मानकीकरण नभईकन सम्भव हुँदैन । पुरानो प्रणालीमा जस्तो टाइप गर्दा एकथोक देखिने तर कम्प्युटरभित्र अर्कै सङ्केतन पद्धतिबाट सङ्ग्रह हुने प्रणाली भएसम्म भाषा कम्युटिङ सम्भव हुँदैन । यसै सिलसिलामा यहाँ विगत केही महिना अगाडिको प्रसङ्ग निकाल्न मन लाग्यो । कुरा के रहेछ भने त्रिभुवन विश्वविद्यालयमा एकजना विद्यार्थीलाई नेपाली साहित्यको शोधपत्र बुझाउनु पर्ने रहेछ । उनले शोधपत्र देवनागरी युनिकोडमा टाइप गरेर बुझाएछन् । तर शोध निर्देशक प्राध्यापक महोदयले सोझै अस्वीकार गर्नुभएछ । विचरा विद्यार्थीले पुनः प्रीति फन्टमा टाइप गरेर लगे पछि शोधपत्र स्वीकृत भएछ ।

देशमा छुवाछुतको भेदभाव त हटिसक्यो तर कम्प्युटर प्रविधिमा अझै बाँकी रहेछ । कम्प्युटर प्रविधिमा यस्तो आमधारणा रहेसम्म भाषा कम्प्युटिङको त के कुरा नेपालीमा टाइप गरेको कुरा विदेशमा वा दूरदराजको कुनै ठाउँमा बसेर हेर्नु पर्‍यो भने यो वा त्यो फन्ट चाहिने रोगले छाड्दैन ।

सम्विधानत: नेपालका सम्पूर्ण भाषाहरूले नेपालको राष्ट्रभाषाको मान्यता पाइसकेको वर्तमान परिवेशमा नेपालीमा मात्र कम्प्युटरमा काम गर्न सक्ने भएर पुग्दैन । बहुभाषामा काम गर्ने वातावरण बनाउन हाल नेपाली वा अङ्ग्रेजीमा भएका कामलाई सहज रूपमा र प्लेटफर्म अनाधारित मानक फर्म्याटिङ प्रणालीमा ढाल्न जरुरी छ । यसो गर्नाले भोली अर्को भाषामा काम गर्दा त्यही कुरा पुन दोहोर्‍याउन पर्दैन ।

उदाहरणका लागि आज अङ्रेजी वा स्पेनिस जुन भाषामा भएपनि भाषा रुपान्तरको समस्या छैन । महिनौ वा वर्षौँ लगाएर बनाएको अनुप्रयोग १/२ दिनमा रुपान्तर गर्न सक्ने अवस्था छ । यसो गर्नलाई भाषा कम्प्युटिङको सहायोग लिन सकिन्छ । कम्प्युटरमा प्रविष्टिदेखिनै निश्चित मानक प्रणाली अपनाउनु पर्छ । लगत सङ्केतन संहिता, भण्डारण प्रकृया तथा त्यसको एकरूपीकृत फर्म्याटिङ प्रणालीले भोली त्यो लगतलाई सजिलै रुपान्तर गर्न सकिन्छ । सूचना प्रविधिका नीति निर्माताका दिमागमा यो कुरा छिर्न सके हिजोआज गरेको काम भविष्यमा पुन दोहोर्‍याइरहन पर्दैनथियो र चाँडैने भाषा कम्प्युटिङको सुरुआत हुने कुरामा विश्वस्त हुन सकिने थियो ।

भाषा मानकीकरण गरी कम्प्युटरमा वा प्रविधिमा सक्षम बनाउन सके भाषाको मात्र होइन सम्पदा संरक्षणमा समेत मद्दत पुग्छ । देशको सम्पदा स्थानीय ज्ञान सामग्रीमा निहित हुनछ । स्थानीय ज्ञानसामग्री भनेको समाजको रक्तसञ्चार हो । यस्तो रक्तसञचारलाई निरन्तरता दिन सूचना प्रविधिमा सरकारी कामकाजको भाषा र सम्पदा, संस्कृतिको ज्ञानभण्डार बनाउन जरुरी हुन्छ । यस्तो ज्ञानभण्डार नभएसम्म नेपालमा भएको यावत काम भनेको विदेशी ऋण लिएर विदेशी आइएनजिओ र इन्टर गभर्न्मेन्टल कमिटीलाई डाटा उपलब्ध गराउने कामभन्दा बढी केही हुन सक्दैन । ऋण नेपालीको थाप्लामा डाटा विदेशीको पोल्टामा बस यत्ति नै हो ।

कतिपय अल्पविकसित देशले प्रविधिका माध्यनबाट भाषा र संस्कृति जोगाउन राष्ट्रिय नीति तथा ऐन बनाएर प्रयास गरिरहेका छन् । यस्ता प्रविधिहरूमा सूचना प्रविधि सबभन्दा महत्वपूर्ण हतियार हो । आजको ज्ञान मानिसको टाउकाले बुझेरमात्र पुग्दैन । यस्तो ज्ञान धातुको टाउकाले वा कम्प्युटरले समेत बुझ्न सक्ने हुनुपर्छ । कम्प्युटर सक्षम भाषा सूचना प्रविधिको अभिन्न अङ्ग भएकाले सूचना प्रविधि नीतिमा नेपाली र नेपालका भाषाको ज्ञानसामग्री भण्डारण गरेर राख्नै पर्छ । तर नेपालको हकमा त भाषा, ज्ञानसामग्री र इतिहासको वास्तविक अध्ययन गर्ने गराउने परिपाटी देखिदैन भने भाषा कम्प्युटिङको कुरा त न नेताले बुझ्छन् न कर्मचारीले ।

नेपाल सूचना प्रविधिको वैश्विक परिदृश्यमा निम्नस्तरमा देखिए तापनि सन्सारभर सूचना प्रविधि विकासको तीव्र परिवर्तनका कारण भाषा प्रविधिले महत्त्वपूर्ण भूमिका खेलिरहेको छ । सूचना प्रविधिको विकास र परिवर्तनसँग समन्वय गर्न भाषा प्रविधि सहितको सूचना प्रविधि नीति आवश्यक छ । सफ्टवेयर घटक, सङ्केतन पद्धति र स्थानीय सामग्रीको निर्माण आदिको ग्यारेन्टी गर्न भाषा प्रविधि नीति सुनिश्चित गरेर स्थानीय भाषामा प्रविधिको पहुँच, विद्युतीय सामग्री निर्माण, स्थानीय सामग्रीको अन्तर परिवर्तनीय क्षमता आदिका लागि पहुँच योग्य बनाउनु पर्दछ ।

सूचना पाठक, दर्शक वा श्रोताले बुझ्ने भाषामा उपलब्ध हुनुपर्छ भन्ने मान्यतालाई अवलम्वन गरी संयुक्त राष्ट्र सङ्घले राज्यपक्ष भएका देशहरूमा संयुक्त राष्ट्र सूचना केन्द्र स्थापना गरेको छ । संयुक्त राष्ट्र सङ्घले साझेदार निकायसँग समन्वय गरेर बडापत्र र पक्षराज्यले हस्ताक्षर गरेका अन्तर्राष्ट्रिय सन्धि सम्झौतालाई ती ती देशका भाषामा अनुवाद गरी तत्‌तत् राष्ट्रहरूलाई उपलब्ध गराउनु पर्ने प्रावधान छ । नेपालको हकमा त संयुक्त राष्ट्र सङ्घका बडापत्र र सन्धि सम्झौताहरू नेपाली र अन्य स्थानीय भाषामा अनुवाद गरी आम जनसमुदायमा पुर्‍याउने काम हुन नसकेको मात्र होइन सरकारी कामकाजको भाषा प्रयोग गर्ने नेपाल सरकार समेत अङ्ग्रेजी भाषामा सूचना उत्पादन गर्छ ।

कम्प्युटरमा स्थानीय भाषा र सांस्कृतिक पहिचानको जानकारी निश्चित कोडमा सेट गरिएको हुनुपर्छ । विभिन्न देशहरूमा स्थानीय भाषा र सांस्कृतिक पहिचानको अलग डाटा हुन्छ । भू-स्थानीय सांस्कृतिक लगतमा भौगोलिक स्थानहरू, भाषा र राष्ट्रिय सांस्कृतिक जानकारी, स्थानीय समय, मिति, समयको नाम र समयका ढाँचाहरू, मुद्रा स्वरूप, मुद्रा प्रतीक, सकारात्मक मुद्रा ढाँचा, मुद्राको नकारात्मक गणनाको प्रबन्धन, मुद्रा ढाँचा, दशमलव प्रतीक, अङ्क समूह प्रतीक, स्थानीय भाषा र लिपिका नाम, नम्बर ढाँचाहरू, नम्बर प्रतीक, नम्बर प्रणाली, शहरका नाम आदि आधारभूत कुराहरूलाई स्पष्ट मानक स्वरूपमा सेटिङ गर्नुपर्छ । यसको समन्वय गरी कार्‍यान्वयनमा लान नेपालमा आइएसओ प्रमाणीकरण गर्ने निकाय पनि छैन । चाउचाउ, साबुन, सिमेन्ट र छडको मानक चाहिँ गुणस्तर विभागले हेर्छ ।

सूचना प्रविधिको परिवर्तनले गर्दा सन्सार द्रूत गतिले परिवर्तन हुँदैछ तर नेपाल सरकारले सूचना प्रविधि नीतिमा सरकारी कामकाजको भाषा र देशका अन्य राष्ट्रभाषाको पहुँच पुर्‍याउन पटक्कै काम गरेको छैन । सूचना प्रविधिका मूल्यमान्यतालाई समाज उपयोगी बनाउन राष्ट्रिय योजना आयोगमा कुनै नीति तथा कार्यक्रम छैन । सूचना प्रविधिमा लोकसेवा, सरकारी र साझेदार कम्पनी, आपूर्ति व्यवस्था, कर्मचारी र ग्राहकबीचका कार्यसम्पादनका तथ्याङ्कहरूमा अन्तरपरिवर्तनीयताको अभाव छ ।

नेपालका जनता मात्र अभागी भन्ने कुरा सत्य होइन रहेछ देशै अभागी रहेछ । सूचना पद्धतिमा व्यवस्थित वा राम्रो काम हुन दिइँदैन । संस्थागत काम हुनलाग्यो भने जरैसमेत उखेलेर फ्याँलिन्छ । राष्ट्रिय कम्प्युटर केन्द्र तथा सूचना प्रविधि उच्चस्तरीय आयोग समाप्त पारियो । अब पनौतीको सूचना प्रविधि पार्क ब्यापारीलाई बेच्ने चाँजोपाँजो मिलाइदैछ भन्ने समाचार पढेकै हो । विज्ञान प्रविधि मन्त्रालय मासेर विभागमा लाने र विभागबाट महाशाखामा लाने काम त भइनै सक्यो । महाशाखाले खेलकुद र पर्यटन समेत हेर्नुपर्ने हुनाले अलग्गै सूचना प्रविधि फाँट बनाउने कसरत भइरहेको छ ।

स्वदेशी भाषामै इन्टरफेसको निर्माण, परम्परागत संस्कृतिका फोटो साझेदारीदेखि बैंक, ऋण प्रक्रिया, विश्वविद्यालय अनुसन्धानका डाटा स्थानीयकरण, भण्डारण प्रक्रियाको राम्रो व्यवस्था भए आफ्नो देशका डाटा विदेशीले लान पाउदैनन् । तर नेपालको विकासमा स्वदेशी सोचको अभाबले गर्दा डिजिटल अर्थव्यवस्थाका डाटा स्थानान्तरण वा कम्पनीहरूको डाटाको सुरक्षा डाटा भण्डारणमा सरकारको नियन्त्रण छैन । आइजिसीका नाममा गोप्य सूचना खोल्नुपर्छ । डाटा स्थानीयकरण नीति र डाटाको स्थानीयकरण पूर्वाधार विकास हुनसकेको छैन । त्यसैले हाल सूचना प्रविधिका माध्यमबाट हुने विदेशी भाषा र संस्कृतिको हस्तक्षेप रोक्न नसकिने अवस्था छ । यस्तो बेलामा भाषा कम्प्युटिङको कुरा र मनको लड्डु घिउसँग खाने कुरा उद्तै उस्तै हुन् नानु भन्नु सिवाय अरु त के नै पो गर्न सकिन्छ र ।

यो पनि पढ्नुहोस्-

भनीसाध्य छैन भाषाको समस्या

The post नेपालमा भाषा कम्प्युटिङ र कल्पनाको लड्डू appeared first on Sajha Post.


Viewing all articles
Browse latest Browse all 942

Trending Articles