जापानमा नयाँ क्रान्तिः वैज्ञानिकले मानसिक चित्रहरूलाई ‘माइंड-क्याप्सनिङ’ मार्फत शब्दमा बदल्न सफल

टोकियो। जापानका एक वैज्ञानिकले मस्तिष्क स्क्यान (Brain Scans) र कृत्रिम बुद्धिमत्ता (AI) प्रयोग गरेर मानिसको मनमा बनेका चित्रहरूलाई यथार्थपरक, वर्णनात्मक वाक्यहरूमा रूपान्तरण गर्ने प्रविधि विकसित गरेका छन्। यो क्रान्तिकारी विधिले ‘दिमाग पढ्ने’ (Mind-reading) दिशामा महत्वपूर्ण फड्को मारेको अनुसन्धानकर्ताहरूले बताएका छन्।

एनटीटी कम्युनिकेसन साइन्स ल्याबोरेटरीजका अनुसन्धानकर्ता टोमोयासु होरिकावाले यो नयाँ विधिलाई ‘माइंड-क्याप्सनिङ’ नाम दिएका छन्। यो प्रविधिले वस्तु, स्थान, कार्य र घटनाहरूका साथै तिनीहरूबीचको सम्बन्ध जस्ता दृश्य विवरणहरू समावेश भएको दिमागको सूचनालाई प्रतिबिम्बित गर्ने वर्णनात्मक पाठ (text) उत्पन्न गर्न एआईको प्रयोग गर्दछ।

कसरी काम गर्छ ‘माइंड-क्याप्सनिङ’ ?

अध्ययनका लागि, होरिकावाले २२ देखि ३७ वर्ष उमेर समूहका चार पुरुष र दुई महिला (सबै जापानी भाषी) को मस्तिष्क गतिविधिलाई विश्लेषण गरे। यी सहभागीहरूले आवाजविहीन २,१८० भिडियो क्लिपहरू हेरेका थिए।

यस अनुसन्धानमा दुई प्रकारका एआई प्रणाली प्रयोग गरियो। पहिलो, ठूला भाषा मोडेल (Large Language Models—LLMs) ले भिडियो क्लिपहरूको क्याप्सनलाई सङ्ख्यात्मक क्रमहरूमा रूपान्तरण गर्‍यो। दोस्रो, ‘डिकोडर’ भनिने सरल एआई मोडेलहरूलाई स्क्यान गरिएको मस्तिष्क गतिविधिलाई यी सङ्ख्यात्मक क्रमहरूसँग मिलाउन तालिम दिइयो।

तालिम पश्चात, होरिकावाले सहभागीहरूको मस्तिष्क गतिविधि डिकोड गर्न यी प्रणालीहरू प्रयोग गरे, जबकि उनीहरूले एआईले पहिले नदेखेका भिडियोहरू हेरिरहेका वा सम्झिरहेका थिए। यसरी, एआईले डेटाबाट सिक्दै जाँदा, मस्तिष्क स्क्यानको आधारमा सहभागीहरूले हेरेका भिडियोहरूको विवरण तयार गर्न सक्षम भयो। रोचक पक्ष त के छ भने, सहभागीहरू जापानी भाषी भए पनि एआई मोडेलले अंग्रेजी भाषामा पाठ उत्पन्न गरेको थियो।

टुकुनीच विश्वविद्यालय, जर्मनीमा एआई र न्यूरोसाइन्सको नैतिकताका प्राध्यापक मार्सेलो इयन्काले यस अध्ययनमा संलग्न नभए पनि, यसलाई ‘दिमाग पढ्ने’ दिशामा एक कदम अगाडि बढेको भन्दै टिप्पणी गरेका छन्।

अपाङ्गता भएकाहरूका लागि ‘वरदान’

होरिकावाका अनुसार, यो विधिले मस्तिष्कको भाषा-सम्बन्धित क्षेत्रहरू (Language Network) को गतिविधि प्रयोग नगरी पनि दृश्य सामग्रीको व्यापक विवरण सिर्जना गर्न सक्छ।

यो प्रविधि विशेष गरी सञ्चार गर्न कठिनाई हुने व्यक्तिहरूका लागि गहिरो स्वास्थ्य हस्तक्षेपको माध्यम बन्न सक्छ। अध्ययनले सुझाव दिए अनुसार, भाषा सञ्जालमा क्षति भएका कारण बोल्न कठिनाई हुने ‘एफेजिया’ (Aphasia) का बिरामीहरू वा एएलएस (ALS—स्नायु-क्षयकारी रोग) जस्ता अवस्थाका बिरामीहरूलाई यसले सहयोग पुर्‍याउन सक्छ।

न्यूयोर्कको बार्नार्ड कलेजका व्याख्याता तथा मनोवैज्ञानिक स्कट ब्यारी कफम्यान भन्छन्, “मलाई लाग्छ यो अध्ययनले बोल्न नसक्ने अटिस्टिक व्यक्तिहरू लगायत सञ्चारमा कठिनाई भएकाहरूका लागि केही गम्भीर हस्तक्षेपहरूको बाटो खोल्छ।”

गोपनीयताको ‘अन्तिम चुनौती’

यो प्रविधिको सफलता—जसलाई शिशुहरू, जनावरहरू वा सपनाका सामग्रीहरू डिकोड गर्न पनि प्रयोग गर्न सकिन्छ— ले गोपनीयताको सन्दर्भमा ठूला नैतिक चुनौतीहरू खडा गरेको छ। यसले कुनै व्यक्तिको निजी विचारहरू उनीहरूले मौखिक रूपमा व्यक्त गर्नु अगावै खुलासा गरिदिने सम्भावना रहन्छ।

प्राध्यापक इयन्काले यदि भविष्यमा यो प्रविधि उपभोक्ताहरूद्वारा बायोमेडिकल उद्देश्यभन्दा बाहिर प्रयोग गरिएमा, यो ‘गोपनीयताको अन्तिम चुनौती’ हुने बताएका छन्।

उनले इलोन मस्कको न्युरोलिंक जस्ता कम्पनीहरूले सामान्य जनसङ्ख्याका लागि न्यूरल इम्प्लान्टहरू विकास गर्ने सार्वजनिक दाबी गरिरहेको उल्लेख गर्दै, यदि यस्तो अवस्था आयो भने मानिसहरूको दिमागमा पहुँच प्रदान गर्नका लागि अत्यन्तै कडा नियमहरू आवश्यक पर्नेमा जोड दिए। मस्तिष्कमा प्रारम्भिक डिमेन्सिया (मन बिर्सने रोग) र मानसिक विकारहरूको ‘हस्ताक्षर’ जस्ता ‘संवेदनशील जानकारी’ समावेश हुने उनी बताउँछन्।

न्युरोराइट्स फाउन्डेसनका निर्देशक Łukasz Szoszkiewicz भन्छन् कि स्नायु विज्ञान (Neuroscience) तीव्र गतिमा अगाडि बढिरहेको छ, तर मानसिक गोपनीयता र विचारको स्वतन्त्रताको सुरक्षामा ढिलाइ गर्न मिल्दैन। उहाँले यस्तो डेटालाई संवेदनशील मानेर, स्पष्ट उद्देश्य-सीमित सहमति (explicit consent) लिनु पर्ने र प्रयोगकर्ता-नियन्त्रित ‘अनलक’ संयन्त्रहरूलाई प्राथमिकता दिनुपर्ने आवश्यकतामा जोड दिएका छन्।

तत्काल ‘दिमाग पढ्ने’ जोखिम कम

यद्यपि, होरिकावा आफैंले यो प्रविधि हाललाई व्यावहारिक प्रयोगको लागि त्यति सटीक नभएको स्वीकार गरेका छन्। उनले आफ्नो अध्ययन विधिले सक्रिय सहभागीहरूको सहयोगमा ठूलो मात्रामा डेटा सङ्कलनको माग गर्ने बताए।

साथै, अध्ययनमा प्रयोग गरिएका भिडियोहरूमा सामान्य दृश्यहरू मात्र समावेश थिए (जस्तै, कुकुरले मानिसलाई टोकेको), असामान्य दृश्यहरू (जस्तै, मानिसले कुकुरलाई टोकेको) होइनन्। त्यसैले, यो प्रविधिले कम अनुमानित मानसिक चित्रहरूलाई कैद गर्न सक्छ कि सक्दैन भन्ने स्पष्ट भइसकेको छैन।

होरिकावाले निष्कर्ष निकालेका छन्, “यस प्रविधिले मानसिक गोपनीयतामा गम्भीर खतरा उत्पन्न गर्छ भनेर केही मानिसहरू चिन्तित हुन सक्छन्, तर वास्तविकतामा, वर्तमान दृष्टिकोणले कुनै व्यक्तिको निजी विचारहरू सजिलै पढ्न सक्दैन।”