शोध आलेख : मशीनी अनुवाद : तकनीकी और वैचारिक दृष्टिकोण / सुयश सुप्रभ

मशीनी अनुवाद : तकनीकी और वैचारिक दृष्टिकोण
- सुयश सुप्रभ

शोध सार : मशीनी अनुवाद ने बीसवीं सदी में अपने शुरुआती दौर में अनुपयोगी कहे जाने से लेकर आज मानवअनुवादक के लिए चुनौती बनने तक वैश्विक स्तर पर एक लंबी यात्रा तय की है। नियम-आधारित मशीनी अनुवाद से शुरू हुई उसकी विकास-यात्रा आज न्यूरल मशीनी अनुवाद तक पहुँच चुकी है। प्रस्तुत शोध आलेख में मशीनी अनुवाद की बीसवीं सदी से अब तक की विकास-यात्रा का विवरण प्रस्तुत करने के साथ उसके मुख्य प्रकारों का विश्लेषण किया गया है। भारत में मशीनी अनुवाद के क्षेत्र में हिंदी से जुड़े प्रयासों को इस शोध आलेख में शामिल किया गया है। मशीनी अनुवाद ने सूचना क्रांति के वर्तमान युग में अपनी उपयोगिता सिद्ध की है। हालाँकि, कई बार उसकी उपयोगिता का संतुलित मूल्यांकन नहीं करके उसे मानव अनुवादक के विकल्प के रूप में प्रस्तुत किया जाता है। इस शोध आलेख में मशीनी अनुवाद की उपयोगिता के प्रति संतुलित दृष्टिकोण का महत्त्व सामने लाने का प्रयास किया गया है।

बीज शब्द : मशीनी अनुवाद, नियम-आधारित मशीनी अनुवाद, कॉर्पस-आधारित मशीनी अनुवाद, प्रत्यक्ष मशीनी अनुवाद, अंतरण मशीनी अनुवाद, अंतराभाषा मशीनी अनुवाद, उदाहरण-आधारित मशीनी अनुवाद, सांख्यिकीय मशीनी अनुवाद, न्यूरल मशीनी अनुवाद, मानव अनुवादक।

मूल आलेख : मशीन या कंप्यूटर प्रणाली के माध्यम से एक प्राकृत भाषा के पाठ का दूसरी प्राकृत भाषा के पाठ में स्वचालित अनुवाद मशीनी अनुवाद कहलाता है। इंटरनेट ने मशीनी अनुवाद के दायरे को विस्तृत करने में महत्त्वपूर्ण भूमिका निभाई है। सूचना क्रांति के वर्तमान युग में पूरा विश्व एक गाँव में बदल चुका है। इस निकटता ने विभिन्न भाषाओं में मशीनी अनुवाद की ज़रूरत को कई गुना बढ़ा दिया है। आधुनिक जीवन में इतनी बड़ी संख्या में पाठ तैयार हो रहे हैं कि केवल मानव अनुवादकों की मदद से इन पाठों का अनुवाद करना संभव नहीं है। इसे इस तथ्य से भी समझा जा सकता है कि अभी 1% से भी कम अनुवाद पेशेवर अनुवादकों द्वारा किया जाता है।1

मशीनी अनुवाद में कंप्यूटर की केंद्रीय भूमिका रही है। हालाँकि, उसकी अवधारणा में कंप्यूटर के शामिल होने से पहले का चरण भी उसकी विकास-यात्रा का एक महत्त्वपूर्ण पड़ाव है। इस चरण की शुरुआत सन् 1933 में हुई जब रूस में पेत्र पेत्रोविच त्रोयान्स्की और फ़्रांस में जॉर्ज आर्त्सरूनी को मशीनी अनुवाद से जुड़े पेटेंट जारी किए गए। उनका कार्य शब्दकोशों के यांत्रिकीकरण पर केंद्रित था।2 इन प्रयासों की सबसे बड़ी सीमा यह थी कि इनमें अनुवाद का दायरा कोशीय शब्दों तक सीमित था। बाद में अमेरिका के रॉकफ़ेलर फ़ाउंडेशन में कार्यरत वॉरेन वीवर ने सन् 1947 में अपने एक पत्र में कंप्यूटर के माध्यम से अनुवाद करने का विचार प्रस्तुत किया।3 हालाँकि, वॉरेन वीवर ने यह विचार औपचारिक रूप से सन् 1949 में अपने एक ज्ञापन में साझा किया।4 इस ज्ञापन का ऐतिहासिक महत्त्व है क्योंकि इसमें पहली बार सांस्थानिक स्तर पर अनुवाद में कंप्यूटर के उपयोग की संभावना का उल्लेख किया गया था। वॉरेन वीवर ने अपने ज्ञापन में मशीनी अनुवाद में सांख्यिकीय विधियों के महत्त्व के बारे में भी लिखा था।5 बाद के दशकों में मशीनी अनुवाद के विकास में उनके इस विचार का महत्त्व सामने आया।

बीसवीं सदी के पाँचवें दशक में सैन्य आवश्यकताओं ने मशीनी अनुवाद की बुनियाद तैयार की। द्वितीय विश्व युद्ध के बाद शांति स्थापित करने के लिए भाषाई बाधाओं को दूर करने के महत्त्व पर चर्चा होने लगी थी। उस समय अमेरिका में विदेशी भाषा में उपलब्ध जानकारी के सैन्य महत्त्व को देखते हुए अनुवाद की ज़रूरत पर बल दिया जाने लगा। अमेरिका में तब मशीनी अनुवाद से जुड़ा शोध रूसी से अंग्रेज़ी में अनुवाद पर केंद्रित था। सन् 1954 में अमेरिका की जॉर्जटाउन यूनिवर्सिटी ने इंटरनेशनल बिज़नेस मशीन्स (आई.बी.एम.) कॉरपोरेशन के सहयोग से रूसी से अंग्रेज़ी में मशीनी अनुवाद का सफल प्रयोग करके दिखाया। यह नियम-आधारित अनुवाद का उदाहरण है। बीसवीं सदी में अस्सी के दशक में कंप्यूटर प्रौद्योगिकी के विकास के साथ पाठ को बहुत बड़ी मात्रा में सहेजना संभव हो गया। इससे मशीनी अनुवाद के विकास को गति मिली। इसी दशक में कॉर्पस-आधारित मशीनी अनुवाद सामने आया। इसके बाद इक्कीसवीं सदी के दूसरे दशक में न्यूरल मशीनी अनुवाद को सर्वाधिक उपयोगी पद्धति के रूप में स्वीकार किया जाने लगा। आज सूचना प्रौद्योगिकी के विकास और भूमंडलीकरण ने अनुवाद के दायरे को बहुत विस्तृत कर दिया है। अनुवाद की ज़रूरत को केवल मानव अनुवादकों के माध्यम से पूरा करना असंभव हो गया है।

मशीनी अनुवाद के विकास के उपर्युक्त संक्षिप्त विवरण के बाद इसके मुख्य प्रकारों का विवरण प्रस्तुत है। मशीनी अनुवाद के दो मुख्य प्रकार हैं : नियम-आधारित मशीनी अनुवाद और कॉर्पस-आधारित मशीनी अनुवाद। नियम-आधारित मशीनी अनुवाद के दो मुख्य प्रकार प्रत्यक्ष मशीनी अनुवाद और अप्रत्यक्ष मशीनी अनुवाद हैं। अप्रत्यक्ष मशीनी अनुवाद में अंतरण मशीनी अनुवाद और अंतराभाषा मशीनी अनुवाद शामिल हैं। वहीं, कॉर्पस-आधारित मशीनी अनुवाद के तीन मुख्य प्रकार उदाहरण-आधारित मशीनी अनुवाद, सांख्यिकीय मशीनी अनुवाद और न्यूरल मशीनी अनुवाद हैं।

बीसवीं सदी में नियम-आधारित मशीनी अनुवाद ने सबसे लंबे समय तक मशीनी अनुवाद में केंद्रीय भूमिका निभाई। इसमें भाषाविज्ञानी स्रोत और लक्ष्य भाषाओं से जुड़े नियम तथा शब्दकोश बनाते हैं, जबकि कंप्यूटर विशेषज्ञ भाषिक नियमों का कंप्यूटर में उपयोग करने के लिए एल्गोरिदम तैयार करते हैं। चूँकि नियम-आधारित मशीनी अनुवाद में स्रोत और लक्ष्य भाषाओं की वाक्य संरचना, शब्द क्रम और पदविन्यास के नियम निर्धारित करने होते हैं, इसमें नये भाषा युग्म जोड़ने में समय लगता है। स्रोत पाठ के अर्थ का विश्लेषण भाषाविज्ञानी द्वारा निर्धारित नियमों और द्विभाषी शब्दकोशों के आधार पर होता है। वहीं, कॉर्पस-आधारित मशीनी अनुवाद भाषाविज्ञानी द्वारा निर्धारित नियमों पर निर्भर नहीं होता है। इसमें अनुवाद के लिए समानांतर कॉर्पस का उपयोग किया जाता है। कॉर्पस-आधारित मशीनी अनुवाद के विकसित होने की एक वजह कंप्यूटर प्रौद्योगिकी के विकास के साथ डिजिटल पाठ का बहुत बड़ी मात्रा में उपलब्ध होना है। डिजिटल पाठ की उपलब्धता के साथ समानांतर कॉर्पस का उपयोग भी बढ़ने लगा, जिसमें स्रोत पाठ और मानव द्वारा अनूदित पाठ का संग्रह होता है।

नियम-आधारित मशीनी अनुवाद में सबसे पहले प्रत्यक्ष मशीनी अनुवाद अस्तित्व में आया। प्रत्यक्ष मशीनी अनुवाद में मध्यस्थ भाषा का प्रयोग किए बिना द्विभाषिक शब्दकोश के माध्यम से सीधे स्रोत भाषा से लक्ष्य भाषा में अनुवाद किया जाता है। चूँकि इसमें शब्दकोश की केंद्रीय भूमिका होती है, इसे ‘शब्दकोश-आधारित पद्धति’ भी कहा जाता है। अप्रत्यक्ष मशीनी अनुवाद के विपरीत, इसमें स्रोत पाठ का बहुत सीमित विश्लेषण किया जाता है। अनूदित वाक्य को लक्ष्य भाषा की वाक्य संरचना को ध्यान में रखकर परिवर्तित किया जाता है। इसे किसी एक स्रोत भाषा और लक्ष्य भाषा को ध्यान में रखकर विकसित किया जाता है। चूँकि इसमें अनुवाद शब्द के स्तर पर होता है, इसमें अनुवाद का स्तर संतोषजनक नहीं होता है। स्रोत पाठ की अर्थगत संरचनाओं के गहन विश्लेषण के अभाव के कारण प्रत्यक्ष मशीनी अनुवाद संतोषप्रद परिणाम नहीं दे पाता है। इस अनुवाद पद्धति का एक उल्लेखनीय उदाहरण अनुसारक है। SYSTRAN (‘सिस्टम ट्रांसलेटर’ का संक्षिप्त रूप) भी अपनी शुरुआत में इसी पद्धति पर आधारित था।

प्रत्यक्ष मशीनी अनुवाद की सीमाओं ने अप्रत्यक्ष मशीनी अनुवाद के विकास की नींव डाली। अंतरण मशीनी अनुवाद को अप्रत्यक्ष मशीनी अनुवाद का पहला मुख्य प्रकार माना जाता है। यह तीन चरणों में होता है : विश्लेषण, अंतरण और संश्लेषण। पहला चरण विश्लेषण का होता है जिसमें स्रोत पाठ को स्रोत भाषा के पार्सर के माध्यम से अमूर्त स्रोत संरचना में बदला जाता है। अंतरण के चरण में इस अमूर्त स्रोत संरचना को अमूर्त लक्ष्य संरचना में बदला जाता है। अंतिम चरण संश्लेषण का होता है जिसमें इस अमूर्त लक्ष्य संरचना को लक्ष्य पाठ में परिवर्तित किया जाता है। भारत में ‘शक्ति’ टूल में अंतरण पद्धति का प्रयोग हुआ है। यूरोप की ‘यूरोट्रा’ (EUROTRA - ‘यूरोपियन ट्रांसलेटर’ का संक्षिप्त रूप) परियोजना भी इसी पद्धति पर आधारित थी।

अंतरण मशीनी अनुवाद के बाद अंतराभाषा मशीनी अनुवाद का विकास हुआ। इस पद्धति में अनुवाद दो चरणों में संपन्न होता है। पहले चरण में स्रोत भाषा से अंतराभाषा में अनुवाद होता है और दूसरा चरण अंतराभाषा से लक्ष्य भाषा में अनुवाद का होता है। अनुवाद विज्ञानी सूरज भान सिंह के अनुसार, अंतराभाषा “वास्तविक भाषा न होकर एक ऐसी भाषानिरपेक्ष भाषा होती है जिसमें सांसारिक ज्ञान (world knowledge) को संकल्पनाओं के प्रतीकों के रूप में निरूपित (represent) किया जाता है।”6 भारत में विकसित ‘आंग्ल-भारती’ इसी पद्धति पर आधारित है।

नियम-आधारित अनुवाद के उपर्युक्त प्रकारों ने मशीनी अनुवाद का महत्त्व स्थापित करने मं। महत्त्वपूर्ण भूमिका निभाई। हालाँकि, उनकी कुछ सीमाएँ थीं जिनका वर्णन ऊपर किया जा चुका है। बीसवीं सदी के आठवें दशक के अंतिम वर्षों में कॉर्पस-आधारित अनुवाद ने उनकी सीमाओं से आगे बढ़कर मशीनी अनुवाद को बेहतर बनाया। उस समय शोधकर्ताओं को यह देखकर आश्चर्य हुआ कि वाक्यविन्यास या शब्दार्थ के विश्लेषण के बिना भी उसमें अनुवाद की गुणवत्ता संतोषप्रद थी।7

कॉर्पस-आधारित अनुवाद का पहला मुख्य प्रकार उदाहरण-आधारित मशीनी अनुवाद है। मशीनी अनुवाद की इस पद्धति में पहले से मौजूद अनुवादों के आधार पर अनुवाद किया जाता है। इसमें अनुवाद के उदाहरणों की सबसे महत्त्वपूर्ण भूमिका होती है। अनुवाद तीन चरणों में होता है। सबसे पहले स्रोत वाक्य के अंशों का समानांतर कॉर्पस में मौजूद स्रोत भाषा वाले उदाहरणों से मिलान किया जाता है, फिर लक्ष्य भाषा में अनुवाद से संबंधित अंशों को संरेखित (अलाइन) किया जाता है। इसके बाद उन अंशों को पुनर्संयोजित किया जाता है। सन् 1988 में जापान में इससे संबंधित शोध लेखन प्रकाशित होने के बाद मशीनी अनुवाद से जुड़े शोधकर्ताओं की इस पद्धति में दिलचस्पी जगी। आयरलैंड में विकसित ‘गाइजिन’ इस पद्धति का एक महत्त्वपूर्ण उदाहरण है।

सांख्यिकीय मशीनी अनुवाद कॉर्पस-आधारित मशीनी अनुवाद का दूसरा मुख्य प्रकार है। इस पद्धति में स्रोत भाषा का पाठ अनूदित करने के लिए समानांतर कॉर्पस में से लक्ष्य भाषा का वह पाठ चुना जाता है जिसमें उसका अनुवाद होने की सबसे अधिक संभाव्यता होती है। इस संभाव्यता की गणना करने के लिए सांख्यिकीय मॉडल का उपयोग किया जाता है। मशीनी अनुवाद में सांख्यिकीय विधियों के महत्त्व का उल्लेख वॉरेन वीवर के पत्र में भी दिखता है। हालाँकि, तब कंप्यूटर प्रौद्योगिकी के विकसित नहीं होने के कारण इस मॉडल पर अधिक शोध-कार्य नहीं किया जा सका। आईबीएम (इंटरनेशनल बिज़नेस मशीन्स) की कैंडिड परियोजना में इस पद्धति की सफलता ने इसके विकास का मार्ग प्रशस्त किया। इस परियोजना में कनाडा की संसद की बहसों की रिपोर्टों के फ़्रेंच और अंग्रेज़ी पाठों के विशाल कॉर्पस का उपयोग किया गया।

सांख्यिकीय मशीनी अनुवाद के विपरीत, कॉर्पस-आधारित न्यूरल मशीनी अनुवाद में कॉर्पस के अनूदित वाक्यों से सीखने की स्वचालित प्रक्रिया अधिक विस्तृत और प्रभावी होती है। इस अनुवाद पद्धति की कोडक-विकोडक संरचना में वाक्य को छोटे खंडों में विभाजित न करके पूरे वाक्य का अनुवाद किया जाता है। कोडक स्रोत वाक्य का निरूपण (रीप्रेज़ेंटेशन) करता है और विकोडक इस निरूपण से अनुवाद उत्पन्न करता है। इसमें अनुवाद की प्रक्रिया मानव मस्तिष्क के तंत्रिका तंत्र की कार्यपद्धति की तरह होती है। इसमें सूचनाओं को ग्रहण करने और आगे बढ़ाने की बहुत विस्तृत और जटिल प्रक्रिया होती है। चूँकि इसमें मशीन के सीखने की प्रक्रिया स्वत: जारी रहती है, इसमें अनुवाद की गुणवत्ता भी बेहतर होती जाती है। अनुवाद की इस पद्धति में लाखों अनूदित वाक्यों वाले कॉर्पस की ज़रूरत होती है। जिन भाषाओं में अभी विशाल कॉर्पस उपलब्ध नहीं हैं, उनमें इस अनुवाद की गुणवत्ता उस स्तर की नहीं है जैसी अंग्रेज़ी, जर्मन जैसी यूरोपीय भाषाओं में है। उदाहरण के लिए, यूरोपीय संसद के दस्तावेज़ों का कॉर्पस उपलब्ध है जिसमें 21 यूरोपीय भाषाओं में अनूदित वाक्य देखे जा सकते हैं। संयुक्त राष्ट्र के समानांतर कॉर्पस में एक करोड़ 10 लाख से अधिक वाक्य छह भाषाओं में उपलब्ध हैं। न्यूरल मशीनी अनुवाद ने इक्कीसवीं सदी के दूसरे दशक में सांख्यिकीय मशीनी अनुवाद को पीछे छोड़ दिया। इसे गूगल ट्रांसलेट के उदाहरण से समझा जा सकता है। सन् 2006 में अस्तित्व में आया गूगल ट्रांसलेट सांख्यिकीय मशीनी अनुवाद पर आधारित था। लेकिन सन् 2016 में उसने न्यूरल मशीनी अनुवाद को अपना लिया। न्यूरल मशीनी अनुवाद में कृत्रिम मेधा की डीप लर्निंग (गहन अधिगम) विधि के कारण अनुवाद की गुणवत्ता बहुत बेहतर हो गई है।

मशीनी अनुवाद के प्रकारों के विश्लेषण के बाद भारत में हिंदी से संबंधित मशीनी अनुवाद के विकास का संक्षिप्त विवरण प्रस्तुत है। बीसवीं सदी में नब्बे के दशक में भारत में मशीनी अनुवाद से जुड़ी अनेक परियोजनाओं की शुरुआत हुई। उन परियोजनाओं में ‘आंग्लभारती’, ‘अनुभारती’, ‘मंत्र’ और ‘मात्रा’ विशेष रूप से उल्लेखनीय हैं। ‘आंग्लभारती’ परियोजना की शुरुआत भारतीय प्रौद्योगिकी संस्थान, कानपुर में प्रोफ़ेसर आर.एम.के. सिन्हा ने सन् 1991 में की थी। इस परियोजना में अंग्रेज़ी से विभिन्न भारतीय भाषाओं में अनुवाद शामिल था। ‘आंग्लभारती’ का लोक स्वास्थ्य सेवा, कार्यालयी पत्राचार आदि क्षेत्रों में उपयोग हुआ है। प्रोफ़ेसर आर.एम.के. सिन्हा ने सन् 1995 में हिंदी से अंग्रेज़ी में अनुवाद के लिए ‘अनुभारती’ परियोजना की शुरुआत की। मुंबई स्थित राष्ट्रीय सॉफ़्टवेयर प्रौद्योगिकी केंद्र (एन.सी.एस.टी.) ने नब्बे के दशक में ‘मात्रा’ नाम का मशीनी अनुवाद-तंत्र बनाया, जो अस्सी के दशक में शुरू हो चुके शोध-कार्य पर आधारित था। इस अनुवाद-तंत्र का उपयोग मुख्य रूप से समाचार के अनुवाद में हुआ है। पुणे स्थित प्रगत संगणन विकास केंद्र (सी-डैक) ने सन् 1999 में ‘मंत्र’ नाम का अनुवाद-तंत्र बनाया। इसमें अधिसूचनाओं, परिपत्रों आदि कार्यालयी साहित्य का अंग्रेज़ी से हिंदी में अनुवाद होता है। इक्कीसवीं सदी में भारत में मशीनी अनुवाद के विकास के नये आयाम सामने आए। सन् 2018 में अनुवाद स्मृति (ट्रांसलेशन मेमोरी) पर आधारित ‘कंठस्थ’ टूल जारी हुआ, जिसमें अंग्रेज़ी से हिंदी और हिंदी से अंग्रेज़ी में न्यूरल मशीनी अनुवाद उपलब्ध है। यह टूल राजभाषा विभाग ने सी-डैक, पुणे के सहयोग से बनाया है। हिंदी और अन्य भारतीय भाषाओं में अभी मशीनी अनुवाद को बेहतर बनाने के लिए स्तरीय कॉर्पस उपलब्ध कराने की ज़रूरत है। कॉर्पस की उपलब्धता सुनिश्चित करने के लिए सरकारी और ग़ैर-सरकारी स्तर पर प्रयास होने चाहिए। अनूदित पाठों का डिजिटलीकरण बहुत धीमी रफ़्तार से हो रहा है। इस प्रक्रिया में तेज़ी लाकर ही भारत में हिंदी और अन्य भाषाओं के मशीनी अनुवाद का विकसित होना संभव हो सकेगा।

मशीनी अनुवाद के तकनीकी पक्ष के साथ उसका वैचारिक पक्ष भी महत्त्वपूर्ण है। इतिहास में मशीनी अनुवाद को अनुपयोगी मानने के कई उदाहरण मौजूद हैं। इसके उलट, उसे वर्तमान सदी में कई बार मानव अनुवादक का विकल्प भी बता दिया जाता है। अमेरिका की एल्पैक (ऑटोमैटिक लैंग्वेज प्रोसेसिंग एडवाइज़री कमिटी) समिति ने सन् 1966 में अपनी रिपोर्ट में मशीनी अनुवाद की गुणवत्ता को असंतोषप्रद बताया। अमेरिका में इस रिपोर्ट के कारण मशीनी अनुवाद से जुड़े शोधकार्यों के लिए आर्थिक सहायता को अनावश्यक माना जाने लगा। बाद में मशीनी अनुवाद के लगातार बेहतर होने जाने के कारण परिस्थितियाँ बदलीं। अब मशीनी अनुवाद को इतना महत्त्व मिलने लगा है कि मानव अनुवादक की जगह मशीनी अनुवादक से अनुवाद करवाने की बात भी होने लगी है।

आज अनुवाद का दायरा जितना व्यापक हो गया है उसे देखते हुए मशीनी अनुवाद को अनुपयोगी मानने की बात सही नहीं लगती है। चाहे विदेशी पर्यटकों के लिए भाषा की बाधा को दूर करना हो या विदेशी भाषा में छपी ख़बर का सारांश जानना हो, मशीनी अनुवाद की उपयोगिता के कई उदाहरण हमारे सामने मौजूद हैं। सूचनापरक और सीमित शब्दावली वाले पाठ के संदर्भ में मशीनी अनुवाद उपयोगी सिद्ध हुआ है।

वहीं, मानव अनुवादक को महत्त्वहीन बताना मशीनी अनुवाद की सीमाओं की अनदेखी करने जैसा है। मानव अनुवादक न केवल पाठ के सामाजिक-सांस्कृतिक संदर्भों को समझने में सक्षम होता है, बल्कि वह पाठ की उन अर्थ-ध्वनियों को भी दूसरी भाषा में व्यक्त करता है जिन्हें समझने के लिए लेखक की विचारधारा या उसके जीवन के विविध पक्षों की जानकारी ज़रूरी होती है। इसके विपरीत, मशीनी अनुवाद में अनुवाद के लिए उन्हीं सूचनाओं को आधार बनाया जाता है जो कॉर्पस या अन्य माध्यम से उपलब्ध कराई जाती हैं। मनुष्य का जीवन इतना बहुआयामी है कि उसे किसी कॉर्पस में समेटना नामुमकिन है। व्यंग्य, व्यंजना आदि का अर्थ समझना कई बार मानव अनुवादक के लिए भी चुनौतीपूर्ण होता है, लेकिन मशीनी अनुवाद में इस सूक्ष्म अर्थों को समझना लगभग असंभव है।

प्राकृत भाषाओं की द्विअर्थकता के संदर्भ में मशीनी अनुवाद की सीमा सबसे स्पष्ट ढंग से सामने आती है। इस प्रसंग में हिंदी के ‘जुआ’ शब्द का उदाहरण दिया जा सकता है। बैलगाड़ी, हल आदि में उस लकड़ी को जुआ कहा जाता है जो पशुओं के कंधे पर रखी जाती है। साथ ही, बाज़ी लगाकर खेले जाने वाले खेल को भी जुआ कहा जाता है।8 अर्थ की यह द्विअर्थकता हर भाषा में दिखती है। मानव अनुवादक सही विकल्प चुनकर शेष विकल्पों को छोड़ देता है। इसके विपरीत, मशीनी अनुवाद प्रणालियों में सांसारिक ज्ञान के अभाव के कारण सही विकल्प चुनना आसान नहीं होता है। मानव के सांसारिक ज्ञान को मशीनी अनुवाद में शामिल करना आज तक असंभव बना हुआ है।

अनुवाद के संदर्भ में अर्थ की जटिलता को एक दूसरे उदाहरण से भी समझा जा सकता है। आज तक ऐसा कोई शब्दकोश प्रकाशित नहीं हुआ है जिसमें किसी भाषा के सभी शब्द शामिल हों। ऐसा करना संभव ही नहीं है क्योंकि नये शब्दों के अस्तित्व में आने की प्रक्रिया हमेशा जारी रहती है। शब्दकोश की यह सीमा मानव अनुवादक की सीमा नहीं बनती है क्योंकि मानव अनुवादक केवल शब्दकोश की मदद से अनुवाद नहीं करता है। वह अपने अनुभव-संसार में उपलब्ध जानकारियों के आधार पर अनुवाद की गुत्थियाँ सुलझाता है। ऐसा करने में वह जितनी रचनात्मकता दिखाता है, उसका अनुवाद उतना प्रभावी बनता है। मशीनी अनुवाद में यह रचनात्मकता नहीं होती है।

इन दिनों गुणवत्ता के मानकों की अनदेखी करके मशीनी अनुवाद से ही काम चलाने की प्रवृत्ति देखी जा रही है। ऐसा प्राय: अनुवाद पर ख़र्च में कटौती करने के लिए किया जाता है। मानव अनुवादक से अनुवाद करवाने के बजाय मशीनी अनुवाद में थोड़ा-बहुत सुधार करके ही उसकी गुणवत्ता को स्वीकार्य बता दिया जाता है। स्तरहीन अनुवाद को स्वीकार्य मानने का एक परिणाम यह हुआ है कि कई अनुवादकों को कम पारिश्रमिक दिया जा रहा है। मशीनी अनुवाद पश्च-संपादन (मशीन ट्रांसलेशन पोस्ट-एडिटिंग) के बढ़ते प्रचलन के कारण कई अनुवादकों को नियमित काम के लिए न चाहते हुए भी मशीनी अनुवाद पर निर्भर होना पड़ रहा है। इस पद्धति में मानव अनुवादक की भूमिका स्रोत पाठ के मशीनी अनुवाद को संपादित करने तक सीमित होती है। चूँकि अनुवाद का पहला चरण मशीनी अनुवाद के माध्यम से संपन्न होता है, अनुवाद कंपनियाँ अनुवादकों को कम अनुवाद दर पर काम करने के लिए कहती हैं। यूरोप में अनेक अनुवादक मशीनी अनुवाद के कारण अनुवाद दर कम होते जाने के कारण आजीविका के किसी दूसरे साधन की तलाश कर रहे हैं। भारत में भी स्वतंत्र अनुवादकों को इस समस्या का सामना करना पड़ रहा है। यह स्थिति तभी बदलेगी जब अनुवाद की जटिलताओं को ध्यान में रखते हुए अनुवादकों को उचित पारिश्रमिक दिया जाएगा।

निष्कर्ष : सूचना क्रांति और भूमंडलीकरण के वर्तमान युग में मशीनी अनुवाद ने भाषाई बाधाओं को दूर करने में महत्त्वपूर्ण भूमिका निभाई है। भाषा और प्रौद्योगिकी से जुड़ी चुनौतियों का सामना करते हुए मशीनी अनुवाद के क्षेत्र में कई उपलब्धियाँ हासिल की गई हैं। हालाँकि, अभी हिंदी समेत अन्य भारतीय भाषाओं में मशीनी अनुवाद की स्थिति यूरोपीय भाषाओं जितनी अच्छी नहीं है। इस दिशा में सार्थक परिवर्तन की उम्मीद तभी की जा सकती है जब इन भाषाओं में गुणवत्तापूर्ण अनुवाद वाले विशाल कॉर्पस उपलब्ध होंगे। इस तथ्य की भी अनदेखी नहीं की जा सकती है कि मशीनी अनुवाद को हर तरह के पाठ के लिए उपयुक्त नहीं माना जा सकता है। उसे मानव अनुवादक के सहायक के रूप में देखने पर ही उसके उपयोग को सही संदर्भ में देखना संभव हो सकेगा।

संदर्भ :

1. एंथोनी पिम एवं एस्टर टॉरेस-साइमन, “इज़ ऑटोमेशन चेंजिंग द ट्रांसलेशन प्रोफ़ेशन?”, इंटरनेशनल जर्नल ऑफ़ द सोशियोलॉजी ऑफ़ लैंग्वेज, अंक 2021, संख्या 270, 2021, पृ. 39-57, https://doi.org/10.1515/ijsl-2020-0015.
2. जॉन हचिन्स, “फ़्रॉम फ़र्स्ट कन्सेप्शन टू फ़र्स्ट डिमन्सट्रेशन : द नेसन्ट ईयर्स ऑफ़ मशीन ट्रांसलेशन, 1947-1954. ए क्रोनोलॉजी”, मशीन ट्रांसलेशन, अंक 12, संख्या 3, 1997, पृ. 195-252, जेस्टोर, http://www.jstor.org/stable/40027329.
3. वही.
4. वही.
5. एलन के. मेल्बी, “फ़्यूचर ऑफ़ मशीन ट्रांसलेशन : म्यूज़िंग्स ऑन वीवर्स मेमो”, कन्साइस हिस्ट्री ऑफ़ द लैंग्वेज साइंसेज़, मिनाको ओ’ हैवन द्वारा संपादित, रूटलेज, 2020, पृ. 627.
6. सूरजभान सिंह, अंग्रेज़ी-हिंदी अनुवाद व्याकरण, प्रभात प्रकाशन, 2006, पृ. 257.
7. डब्ल्यू. जॉन हचिन्स, “मशीन ट्रांसलेशन : ए ब्रीफ़ हिस्ट्री”, कन्साइस हिस्ट्री ऑफ़ द लैंग्वेज साइंसेज़ : फ़्रॉम द सुमेरियन्स टू द कॉग्निटिविस्ट्स, ई.एफ़.के. कोएर्नर एवं आर.ई. एशर द्वारा संपादित, पेर्गामन, 1995, पृ. 440.
8. हरीश कुमार सेठी, ई-अनुवाद और हिंदी, किताबघर प्रकाशन, 2013, पृ. 372.

सुयश सुप्रभ
शोधार्थी (हिन्दी अनुवाद), जे.एन.यू, नई दिल्ली
translatedbysuyash@gmail.com

संस्कृतियाँ जोड़ते शब्द (अनुवाद विशेषांक)

अतिथि सम्पादक : गंगा सहाय मीणा, बृजेश कुमार यादव एवं विकास शुक्ल

चित्तौड़गढ़ (राजस्थान) से प्रकाशित UGC Approved Journal

अपनी माटी (ISSN 2322-0724 Apni Maati) अंक-54, सितम्बर, 2024

Facebook SDK

शोध आलेख : मशीनी अनुवाद : तकनीकी और वैचारिक दृष्टिकोण / सुयश सुप्रभ

Post a Comment

एक टिप्पणी भेजें

संपर्क फ़ॉर्म

Facebook SDK

शोध आलेख : मशीनी अनुवाद : तकनीकी और वैचारिक दृष्टिकोण / सुयश सुप्रभ

Links to this post

Post a Comment

एक टिप्पणी भेजें

संपर्क फ़ॉर्म