गांव-दर-गांव एक ऐसे काम से AI को मिल रही मजबूती, जो शिक्षित भी करता है
'कार्या' का मंत्र है, 'अर्न, लर्न एंड ग्रो' यानी 'कमाओ, सीखो और आगे बढो. कंपनी भारत या कहीं भी डाटासेट तैयार करने के तरीके में क्रांतिकारी बदलाव लाना चाहती है.
रात के 10.30 बज चुके हैं, लेकिन एक लंबे थकानभरे दिन के बाद सोने से पहले बेबी राजाराम बोकाले को एक और काम पूरा करना है.
वह बिस्तर पर पैर मोड़कर बैठ गई हैं. एक कोने में रंग-बिरंगी लड़ियों के बीच भगवान श्रीकृष्ण की प्रतिमा जगमगा रही है. बिस्तर के ठीक ऊपर उनके स्वर्गीय पति की तस्वीर लगी है, जिसमें वह अपनी घनी मूछों के साथ बिलकुल आंखें मिलाकर देखते हुए प्रतीत हो रहे हैं.
पुणे के नजदीक एक कस्बे खराड़ी में रहने वाली बोकाले ने बिस्तर पर पहुंचकर अपना स्मार्टफोन खोला और अपनी साफ, स्पष्ट आवाज में अपनी मातृभाषा एवं महाराष्ट्र राज्य की भाषा मराठी में तेज आवाज में एक कहानी पढ़ने लगीं.
अन्य कई लोगों की तरह ही बोकाले की आवाज भी एआई मॉडल्स को मराठी में प्रशिक्षित करने के काम आएगी. इस काम के साथ-साथ वह अपने लिए तरह-तरह की चीजें सीख रही हैं. आज की कहानी उन्हें पर्सनल फाइनेंस के बारे में सिखा रही है. जो कहानी उन्होंने पढ़ी है, उसे रोचक तरीके से "बैंक किस तरह काम करते हैं और धोखाधड़ी एवं जालसाजी से कैसे बचें व सुरक्षित रहें" जैसी व्यावहारिक जानकारियां देने के लिए तैयार किया गया है.
वह बताती हैं, "अब मैं अपने स्मार्टफोन से कई रोचक काम करने में सक्षम हुई हूं." उन्होंने भारत के यूपीआई पेमेंट सिस्टम के माध्यम से भुगतान करना सीख लिया है. उन्होंने कई अन्य बातों के साथ-साथ यह भी सीख लिया है कि बैंकिंग के लिए फोन का इस्तेमाल कैसे किया जाता है.
बोकाले सोशल इंपैक्ट ऑर्गनाइजेशन कार्या (Karya) के लिए काम करती हैं. 'कार्या' एक संस्कृत शब्द है, जिसका अर्थ है ऐसा काम, जो आपको सम्मान दिलाए. यह कंपनी स्वयं को दुनिया की सबसे अग्रणी एथिकल डाटा कंपनी बताती है.
'कार्या' का मंत्र है, 'अर्न, लर्न एंड ग्रो' यानी 'कमाओ, सीखो और आगे बढो. कंपनी भारत या कहीं भी डाटासेट तैयार करने के तरीके में क्रांतिकारी बदलाव लाना चाहती है. इसका लक्ष्य यथासंभव ज्यादा से ज्यादा लोगों को गरीबी के दुष्चक्र से बाहर निकालने के साथ-साथ उन्हें ऐसे टूल्स प्रदान करना है, जो आधुनिक डिजिटल इकोनॉमी में उन्हें आगे बढ़ने में मदद करें. इसके साथ ही कार्या एक गैरपारंपरिक वर्कफोर्स की मदद से हाई-क्वालिटी एवं एथिकल डाटासेट भी तैयार कर रही है.
ये डाटासेट बेशकीमती हैं. 8 करोड़ लोग मराठी बोलते हैं, लेकिन डिजिटल दुनिया में इसका खास प्रतिनिधित्व नहीं है. भारत में अगर आपको हिंदी या अंग्रेजी नहीं आती है, तो आपके लिए कई टेक्नोलॉजी तक पहुंच मुश्किल हो जाती है. आप इस तरह के कई एप्स, टूल्स एवं डिजिटल असिस्टेंट का प्रयोग करने में सक्षम नहीं हो पाते हैं, जो हिंदी या अंग्रेजी बोलने वालों के लिए बहुत सुलभ हैं. असल में ऐसे लोगों की संख्या करोड़ों में हैं, जिन्हें इस तरह की टेक्नोलॉजी से लाभ मिल सकता है और जो इनके संभावित उपभोक्ता हैं. इसी बात को ध्यान में रखते हुए माइक्रोसॉफ्ट एवं अन्य कंपनियां अपने प्रोडक्ट्स को ऐसे लोगों के लिए भी सुलभ बनाना चाहती हैं, जो कोई कम प्रचारित भाषा बोलते हैं.
53 साल की बोकाले कहती हैं, "मुझे यह सोचकर गर्व होता है कि मेरी आवाज रिकॉर्ड हो रही है और कहीं कोई मेरी आवाज सुनकर मराठी सीखेगा. और मुझे इस बात का भी गर्व है कि इन टूल्स एवं फीचर्स को मराठी में उपलब्ध कराया जाएगा."
वह अपने घर से ही मसाले एवं मिर्च पीसने का छोटा सा व्यवसाय चलाती हैं. वह कहती हैं, "मैंने यहां जो कमाया, उसका प्रयोग ग्राइंडर को रिपेयर कराने एवं कुछ अन्य पार्ट्स को खरीदने में किया. अगर मैंने यह काम न किया होता तो मेरे पास इसके लिए पैसे नहीं होते."
कार्या: हाई-क्वालिटी डाटा तैयार करने के साथ-साथ गरीबी उन्मूलन
एआई मॉडल्स को प्रशिक्षित करने एवं रिसर्च करने के लिए कार्या कई भारतीय भाषाओं में डाटासेट तैयार कर रही है, साथ ही इसने भारत के कई गांवों में रोजगार के अवसर भी सृजित किए हैं.
माइक्रोसॉफ्ट रिसर्च प्रोजेक्ट के रूप में 2017 में 'कार्या' की शुरुआती हुई थी.
समय के साथ यह स्पष्ट होता गया कि भारत में हाई-क्वालिटी लैंग्वेज डाटासेट तैयार करने और शिक्षा एवं आय के स्रोत के माध्यम से ग्रामीण भारतीयों को गरीबी से बाहर निकालने में मदद करने जैसे दोनों क्षेत्रों में 'कार्या' में अपार संभावनाएं हैं. प्रोजेक्ट को 2021 में माइक्रोसॉफ्ट से अलग एक ऑर्गनाइजेशन के रूप में काम का मौका मिला. इसका पूरा ऑपरेशन माइक्रोसॉफ्ट एज्यूर पर तैयार किया गया है और यह ओपनएआई सर्विस का प्रयोग करता है. इसमें वह एप भी शामिल है, जिस पर लोग काम करते हैं और अपनी मातृभाषाओं में रिकॉर्डिंग एवं लेखन करते हैं. डाटा को वैलिडेट करने के लिए इसमें एज्यूर एआई कॉग्निटिव सर्विसेज का प्रयोग भी किया जाता है. माइक्रोसॉफ्ट इसके सबसे बड़े क्लांट्स में से है.
'कार्या' बोकाले जैसे काम करने वालों को एक घंटे के लिए करीब 5 डॉलर का भुगतान करती है, जो भारत में मिलने वाले न्यूनतम तय वेतन से कहीं ज्यादा है. 11 दिन में बोकाले ने करीब पांच घंटे काम किया और 2,000 रुपये यानी करीब 25 डॉलर कमाए. यह काम उन्हें व्यस्त भी रखता है और साथ ही सिखाने का काम भी करता है. 'कार्या' के साथ काम करने वालों को उनको मिले ज्ञान के साथ समृद्ध करने के लिए लगातार सहयोग भी किया जाता है. इतना ही नहीं, अगर कार्या पर तैयार किया गया डाटा पुन: बेचा जाता है, तो काम करने वाले को उसकी रॉयल्टी भी मिलती है.
'कार्या' के संस्थापकों का लक्ष्य महत्वाकांक्षी है. 'कार्या' ने 2030 तक 10 करोड़ लोगों तक पहुंचने के लक्ष्य के साथ 200 से ज्यादा अन्य गैर लाभकारी संगठनों के साथ साझेदारी की है. कंपनी का मानना है कि यहां तैयार किया गया डाटा ऐसे टूल्स तैयार करने का आधार बनेगा, जो आगे चलकर उन्हीं लोगों को उनकी अपनी भाषा में काम करने में मदद पहुंचाएंगे. 'कार्या' डाटासेट को इस तरह से एकत्र और प्रोसेस करने का प्रयास करती है, जिसमें लैंगिक आधार पर या अन्य किसी आधार पर कोई भेदभाव न हो. यही कारण है कि ज्यादा से ज्यादा समावेशी डाटा तैयार करने के लिए कार्या अलग-अलग लोगों तक पहुंच रही है.
27 वर्षीय मनु चोपड़ा कंपनी के संस्थापकों में से हैं और इसके सीईओ भी हैं. वह कहते हैं कि डिजिटल दुनिया में कम प्रतिनिधित्व वाली भाषाओं में डाटासेट की बड़ी मांग के साथ-साथ यह तथ्य बहुत बड़ा अवसर बनकर सामने आ रहा है कि आज 78 प्रतिशत ग्रामीण भारतीयों के पास स्मार्टफोन है. कार्या अपने लाभ का बड़ा हिस्सा अपने साथ काम करने वालों में बांटती है और लाभ का उतना हिस्सा ही अपने पास रखती है, जिससे स्टाफ को पूरा सपोर्ट मिल सके और ज्यादा से ज्यादा रिसर्च की जा सके.
चोपड़ा कहते हैं, "अगर खुलकर कहें तो दुनिया एआई पर एक ट्रिलियन डॉलर खर्च करने जा रही है. इसलिए सवाल है कि अगले 20 साल में मैं इसमें से कितना हिस्सा सीधे उन लोगों की जेब में पहुंचा सकूंगा, जिन्हें इसकी सबसे ज्यादा जरूरत है? हम सच में मानते हैं कि ग्रामीण भारत न केवल एआई को मजबूत करने में महत्वपूर्ण भूमिका निभा सकता है, बल्कि एआई टेक्नोलॉजी का प्रयोग करने वाला भी यह बड़ा वर्ग है."
बोकाले भी भारत के 28 में से 24 राज्यों के कस्बों एवं गांवों में कार्या के लिए काम कर रहे 30,000 से ज्यादा लोगों में से एक हैं.
सीमित संसाधन वाली भाषाओं में टेक्नोलॉजी की पहुंच बना रहे आसान
ओपनएआई के चैटजीपीटी और माइक्रोसॉफ्ट के कोपायलट जैसे टूल्स अंग्रेजी में इसलिए बहुत अच्छी तरह काम कर पाते हैं, क्योंकि इस भाषा में इंटरनेट पर लिखे हुए (रिटेन) और बोले हुए (ऑडियो) मैटेरियल की भरमार है. 140 करोड़ लोगों के देश भारत में 22 आधिकारिक भाषाएं, सैकड़ों अन्य भाषाएं एवं हजारों बोलियां हैं. करीब 60 प्रतिशत भारतीय हिंदी बोलते हैं और करीब 10 प्रतिशत अंग्रेजी बोलते हैं. इनके अलावा करोड़ों लोग ऐसे हैं, जो डिजिटल टूल्स के मामले में पीछे रह गए हैं, जबकि ये टूल्स उन्हें आधुनिक दुनिया में आगे बढ़ने में मदद कर सकते हैं.
बेंगलुरु की माइक्रोसॉफ्ट रिसर्च लैब में लैंग्वेज टेक्नोलॉजिस्ट एवं रिसर्चर के रूप में कार्यरत कलिका बाली कहती हैं, "मुझे लगता है कि हमें यह समझना होगा कि इंटरनेट पर ज्यादातर सबकुछ अंग्रेजी में होना बहुत अच्छी शुरुआत नहीं है." वह कार्या की ओर से जुटाए गए डाटा का अपने रिसर्च के लिए प्रयोग करती हैं.
वह कहती हैं, "लोगों को चारों ओर डिजिटल इकोनॉमी में हो रहे विकास का हिस्सा बनाने की जरूरत है. किसी को भी केवल उसकी भाषा के कारण टेक्नोलॉजी के प्रयोग से वंचित नहीं किया जाना चाहिए. माइक्रोसॉफ्ट में हम कहते हैं कि हम पूरी दुनिया को सशक्त करना चाहते हैं, है ना? और दुनिया की आधी से ज्यादा आबादी अंग्रेजी से इतर अन्य भाषाओं का प्रयोग करती है."
बाली कहती हैं कि एआई ने भाषाओं के संरक्षण और लार्ज लैंग्वेज मॉडल्स (एलएलएम) में उनके प्रयोग की प्रक्रिया को बहुत तेज किया है. यह ऑनलाइन एवं एआई टूल्स बनाने में तो महत्वपूर्ण है ही, साथ ही दुर्लभ एवं विलुप्त होती भाषाओं के संरक्षण के लिए भी महत्वपूर्ण है.
उन्होंने कहा, "आज की तारीख में हम कोपायलट जैसे टूल्स पहले से कहीं जल्दी बना सकते हैं. पहले जब हम भाषाओं के संरक्षण की बात करते थे, तो हम ऐसे प्रयासों की बात कर रहे होते थे, जिनमें दशकों का समय लगना है. सच कहूं... अब ये सब हम मात्र कुछ महीनों में कर सकते हैं."
'कार्या' का कहना है कि 2024 के अंत तक वह 1,00,000 से ज्यादा लोगों के साथ काम कर रही होगी. कंपनी ऐसे लोगों की सहभागिता चाहती है जो काम एवं शिक्षा दोनों चाहते हैं, विशेषरूप से ग्रामीण क्षेत्रों की महिलाएं. अच्छे खासे मेहनताने के साथ-साथ कंपनी जरूरी प्रशिक्षण एवं काम होने पर अन्य समर्थन भी प्रदान करती है.
'टेक्नोलॉजी लोगों के सपनों को सच में बड़ा कर देती है'
चोपड़ा दिल्ली की एक बस्ती यानी अनाधिकृत कॉलोनी में पले-बढ़े हैं. वह कहते हैं कि अपने शुरुआती दिनों में उन्होंने जो असमानताएं देखी थीं, कैलिफोर्निया की स्टैनफोर्ड यूनिवर्सिटी में एआई पर फोकस करते हुए कंप्यूटर साइंस की पढ़ाई के दौरान वही अनुभव उनके सामने एक उद्देश्य बनकर खड़ा था.
वह बताते हैं, "जब मैं भारत वापस आया, तो हर जगह मैंने जो पहली बात अनुभव की, वह यह थी कि लोग गरीबी से बाहर निकलने को आतुर थे. हर व्यक्ति कठिन परिश्रम कर रहा था और हर किसी के पास महत्वाकांक्षा थी. इन बातों के साथ-साथ उनमें नया कौशल सीखने की क्षमता थी. अगर लोगों में ये दो भावनाएं हों, तो टेक्नोलॉजी सच में उनके सपनों को बड़ा करने में और कुछ हासिल करने में मदद कर सकती है."
11 दिनों में बोकाले ने जो काम किया, वह एक पायलट प्रोजेक्ट का हिस्सा है. इसमें यह परखने का प्रयास किया गया है कि क्या महत्वपूर्ण बातों को सीखते हुए डाटा इनपुट का काम किया जा सकता है. अपने लिए ठीक-ठाक पैसा कमाने के साथ-साथ उन्हें उन फाइनेंशियल टूल्स के बारे में जानने का भी मौका मिला, जिनकी जरूरत उन्हें अपने पैसे के समझदारी से प्रयोग के लिए होती है.
इस पायलट प्रोजेक्ट के दौरान मैटेरियल को दो बहनों से जुड़े धारावाहिक के रूप में प्रस्तुत किया गया. काम करने वालों को अपने स्मार्टफोन में इसी कहानी को मराठी में तेज आवाज और लय के साथ पढ़ना था. बोकाले कहती हैं, "इस कहानी में आम लोग हैं, जो रोजाना कठिन परिश्रम करते हैं. वह जो कमाते हैं, आसानी से खर्च हो जाता है और कोई बचत नहीं हो पाती है. संक्षेप में कहें तो सवाल यह है कि बचत कैसे की जाए."
'कार्या' की चीफ इंपैक्ट ऑफिसर साफिया हुसैन ने कहा कि कहानी वाला यह फॉर्मेट सफल रहा है और कई प्रतिभागियों ने अपने परिवार के सदस्यों एवं दोस्तों के बीच इस कहानी को तेज आवाज में पढ़ा.
हुसैन ने कहा, "वे सब कह रहे थे कि हम ये काम करेंगे और आपके लिए कहानी को पढ़ेंगे. वे उत्साहित थे कि आगे क्या होने वाला है? क्या उसे लोन मिलेगा? या फिर, क्या उसके पास शादी के लिए पर्याप्त पैसे होंगे?"
वह कहती हैं कि काम को सीख से जोड़ते हुए 'कार्या' अपने साथ काम करने वालों को सम्मान देने का प्रयास कर रही है तथा आय के साथ-साथ उनके लिए और भी अर्थपूर्ण परिणाम सृजित कर रही है. वह कहती हैं, "हम लोगों को उनके समय की कीमत दे रहे हैं और साथ ही हम कह सकते हैं कि वे कुछ ऐसा कर रहे हैं, जो उनके लिए मूल्यवान है. यहां खाली समय में आपके पास कुछ सीखने के लिए भी है."
हुसैन ने उम्मीद जताई कि समय के साथ 'कार्या' के साथ काम करने वाले अलग-अलग भूमिकाओं में इससे जुड़ेंगे, जिसमें ऑर्गनाइजर एवं लोकल एडमिनिस्ट्रेटर जैसी भूमिकाएं शामिल हैं. बड़े परिदृश्य में देखें तो हमारा उद्देश्य है कि टेक्नोलॉजी हर किसी के लिए काम करे.
वह कहती हैं, "हम मराठी व इस तरह की अन्य भाषाओं में डाटा जुटा रहे हैं और इसके पीछे हमारी कोशिश यह सुनिश्चित करना है कि इन भाषाओं से जुड़े करोड़ों लोग टेक्नोलॉजी की इस क्रांति में पीछे न छूट जाएं."
प्रोजेक्ट से जोड़ रहे हैं पूरा समाज
माइक्रोसॉफ्ट रिसर्चर कलिका बाली ने कहा कि 'कार्या' की सफलता एक अहम पहलू यह है कि कंपनी अपने प्रोजेक्ट में पूरे समाज को जोड़ने की कोशिश करती है. कार्या के साथ ज्यादातर महिलाएं काम कर रही हैं और देखा जाए तो पुरुषों की तुलना में महिलाओं के पास ऐसे लोगों का दायरा ज्यादा बड़ा होता है, जिन्हें एक-दूसरे पर भरोसा होता है.
उन्होंने कहा, "पुरुष बस दो चीजें पूछना चाहते हैं: क्या यह काम मेरे लायक है और क्या मुझे इसके लिए पैसे मिलेंगे? दूसरी ओर, महिलाओं के प्रश्न होते हैं: क्या परिवार वाले इसे स्वीकार करेंगे? यह काम करने से मेरे या मेरे परिवार की बदनामी तो नहीं होगी? क्या इस काम से किसी भी तरह मुझे नुकसान हो सकता है? इन सब सवालों के जवाब मिलने के बाद ही पैसा उनकी प्राथमिकता में आता है. कार्या के साथ बड़ा फायदा यही है कि इसने जमीनी स्तर पर भरोसा कायम किया है. कंपनी जहां काम कर रही है, वहां पूरे समुदाय के साथ मिलकर चल रही है."
अपने आसपास बोकाले एक जाना-पहचाना नाम हैं, जहां लोग उन्हें बेबी ताई कहते हैं. ताई का अर्थ है 'बड़ी बहन'. वह कई दर्जन अन्य महिलाओं के साथ मिलकर एक अनौपचारिक फाइनेंशियल नेटवर्क चलाती हैं, जहां सब महिलाएं मिलकर हर महीने अपनी बचत को जमा करती हैं और अपनी बारी आने पर एक साथ ज्यादा पैसा पा जाती हैं. यह पैसा कोई छोटा कारोबार शुरू करने या बच्चों की स्कूल फीस भरने जैसे कामों में मददगार होता है. ये महिलाएं अक्सर उनके पेड़ों वाले आंगन में कभी कामकाज की बात करने तो कभी बस ऐसे ही कुछ हल्के-फुल्के पल बिताने के लिए जुटती हैं. वहीं छोटी सी बैठक के एक तरफ टिन शेड में मिर्च एवं मसाला पीसने वाली उनकी चक्की लगी है.
51 वर्षीय सुरेखा संजय गायकवाड़ उनकी पड़ोसी और सखी हैं. वह अपने घर से करीब आधे घंटे की दूरी पर एक ग्रॉसरी का छोटा सा स्टोर चलाती हैं. वह भी अपने फोन में कार्या के लिए मराठी में पढ़ती हैं. इस अनुभव के बारे में पूछने पर बोकाले के बगल में बैठी सुरेखा चहक उठती हैं.
वह कहती हैं, "मुझे भरोसा ही नहीं हो रहा है कि मैं घर से ऐसा कोई काम कर सकती हूं. अब मुझे काम के लिए बस नहीं पकड़नी होती और न ही दिन बीतने के बाद कहीं दूर से आना होता है."
सुरेखा कहती हैं कि काम के साथ-साथ मिलने वाली सीख एक अतिरिक्त लाभ है. उन्होंने काम करते हुए सीखा कि बैंक में फिक्स्ड डिपोजिट कैसे करते हैं और अपने बेटे की कॉलेज की पढ़ाई के लिए प्रभावी तरीके से बचत करते हुए उन्होंने एफडी खोल भी ली है.
हाल ही में 'कार्या' के लिए काम कर चुकी कई अन्य महिलाएं भी बातचीत के लिए बोकाले के घर पर रुकी थीं. 55 वर्षीय मीना जाधव ने इससे कमाए पैसों से अपने टेलरिंग के काम के लिए सिलाई से जुड़े कुछ सामान खरीदे हैं. वह शर्ट बनाकर बेचती हैं. यहां से मिली सीख की बदौलत अब वह सेविंग्स अकाउंट भी खुलवा चुकी हैं और उन्हें पता चल गया है कि एटीएम का प्रयोग कैसे करते हैं. इससे पहले उन्हें पता ही नहीं था कि आप बैंक जाए बिना भी पैसे निकाल या जमा कर सकते हैं.
एक अन्य महिला ने यहां से मिली सीख और यहां से हुई कमाई से अपनी बेटी की पढ़ाई के लिए एक सेविंग्स अकाउंट खोला है.
उन सभी का कहना है कि उन्हें यहां काम करके मजा आया और फाइनेंशियल प्लानिंग एवं ऑनलाइन टूल्स के बारे में यहां मिली जानकारियां उनके लिए फायदेमंद साबित हुईं.
वह कहती हैं कि पायलट प्रोजेक्ट से जुड़ने से पहले इनमें से कई महिलाएं यह भी नहीं जानती थीं कि स्मार्टफोन का प्रयोग कैसे करते हैं. उनके पति और ससुराल वाले आश्चर्य से कहते हैं, "वाह, तुमने तो कई नई चीजें सीख ली हैं. यह सच में शानदार है."
Edited by रविकांत पारीक