ஏஐ எப்படி பதில் சொல்கிறது?

நான் பள்ளிபடித்த காலத்தில் கட்டுரைப் போட்டி ஒன்றுக்குச் சென்றிருந்தேன். மதுரையின் சுற்றுவட்டார ஊர்கள் என்று தலைப்பு கொடுத்து எழுதச் சொன்னார்கள். ஏதோ ஓருமுறை மதுரைக்குப் பெற்றோர்கள் கூட்டிச் சென்றிருந்தபோது ‘கோச்சடை’ என்ற பெயரில் டவுன் பஸ் ஓன்றைப் பார்த்த ஞாபகம். அதை வைத்து ஒரு மன்னருக்கு பெரிய சடை இருந்தது, அந்த சடையை அவர் ஒருநாள் அவிழ்த்துக் காட்டிய இடத்திற்கு கோச்சடை என்று பெயர் வைத்தார்கள், அவர்தான் ஜடாவர்ம சுந்தர பாண்டியன் என்று மூளைக்குள் இருந்த சிலபல அருஞ்சொற்களைத் தொடர்புபடுத்திக் கற்பனைக் குதிரையைத் தட்டிவிட்டு எழுதிவந்தேன். அதற்கு மார்க் போட்டு பரிசெல்லாம் கொடுத்தார்கள். நமக்குத் தெரியாத தகவலெல்லாம் இந்த பையனுக்குத் தெரிந்திருக்கிறது என்று நினைத்திருப்பார்கள் போல.

Probability என்பதற்கு ‘நிகழ்தகவு’ என்ற அழகான தமிழ் வார்த்தையைத் தமிழ் மீடியத்தில் உபயோகித்துவருகிறார்கள். மென்பொருள், வலைத்தளம், காணொளி போல காலத்திற்கேற்ப உருவாக்கப்பட்ட வார்த்தை இது. ‘சாத்தியக்கூறு’ என்ற சமஸ்கிருதம் கலந்த வார்த்தையை வழக்கொழிக்கும் புண்ணியம் கிட்டிய தூய தமிழ் வார்த்தை ‘நிகழ்தகவு’. ‘நிகழ்’ என்ற பழந்தமிழ் வார்த்தையை முதலில் எடுத்திருக்கிறார்கள். தக்கார், தகவிலர் என்று தகவைப் பிடித்து அதனுடன் இணைத்திருக்கிறார்கள். அழகான வார்த்தை ஒன்று வந்து உட்கார்ந்து விட்டது. நிகழ்தகவில் உருவான வார்த்தை ‘நிகழ்தகவு’. தாயம் உருட்டினால் ஆறு விழும் என்பது நிகழ்தகவு. நாளை மழை பெய்யும் என்பது நிகழ்தகவு. 2026-இல்… என்பது நிகழ்தகவு. நிகழாத்தகவு என்று புது வார்த்தையைக் கூட உருவாக்கலாம்.

ஏஐ உரையாடல் செயலிகள் (chat bots) நாம் கேட்கும் கேள்விக்கான பதில்களை இந்த நிகழ்தகவு அடிப்படையில் சொல்கின்றன. அவற்றின் படைப்புகளும் இந்த நிகழ்தகவின் அடிப்படையில் படைக்கப்படுவன. அதனால்தான் அவற்றிடம் ஒரே கேள்வியை இரண்டுமுறை கேட்டால் ஏறக்குறைய ஒரே பதிலைச் சொன்னாலும் ஒரேமாதிரி சொல்லாது. ஒரே படத்தை வரையச் சொன்னால் முதலில் வரைந்த அதே படத்தை மறுபடியும் வரையாது. ஒவ்வொரு முறையும் அது தாயக்கட்டையை உருட்டி அந்த கேள்விக்கு நெருங்கிய தகவலை நிகழ்தகவின் அடிப்படையில் தொகுத்துக் கொடுக்கும். அதற்குத் தெரிந்த ஒரு விஷயம் மனிதர்கள் எழுதும் மொழியின் லாஜிக். வார்த்தைகள், இலக்கணம் இரண்டையும் லாஜிக் அடிப்படையில் அதனுள் ஏற்றி வைத்திருக்கிறார்கள். இரண்டாவது விஷயம், இந்த லாஜிக் அடிப்படையில் அது சம்பந்தப்பட்ட வார்த்தைகளை நிகழ்தகவு அடிப்படையில் கோர்ப்பது.

இன்டர்நெட்டிலுள்ள அத்தனை டேட்டாவும் மனித எழுத்து மொழிதான். எழுத்துகள் மட்டுமல்ல. வீடியோ, போட்டோ, வாய்ஸ் என்று எல்லாவற்றையும் எழுத்து மொழியாக மாற்றிவிடலாம். ஏஐ பற்றிய முந்தைய பதிவில் எழுதியிருந்தது போல யாராவது பாகங்குறிக்க வேண்டும். இந்த படத்திலுள்ள இந்த தலை சைடு உச்சி என்று பாகங்குறித்து எழுத வேண்டும். அதை நேர் உச்சியிலிருந்து வேறுபடுத்த வேண்டும். கண்ணின் இமை முடி என்று எவ்வளவு நுட்பமாகப் பாகங்குறித்து உள்ளே ஏற்றுகிறார்களோ அந்த அளவு நுட்பமாக ஏஐ-யின் படைப்புகளும் இருக்கும். இந்த ஏஐ எந்திரங்களுக்குள் ஏழு, எட்டு வருடங்களாக இன்டர்நெட்டிலுள்ள எல்லா டேட்டாவையும் மனித மொழிகளாக மாற்றி ஏற்றிவைத்திருக்கிறார்கள். ஏற்றிக் கொண்டிருக்கிறார்கள்.

நாம் அதனிடம் ஒரு கேள்வியைக் கேட்கும்போது அது நாம் கேட்ட கேள்வியிலுள்ள வார்த்தைகளை வைத்து நிகழ்தகவின் அடிப்படையில் முதலில் ஒரு வார்த்தையைக் கண்டுபிடிக்கிறது. அதனுடன் இணைக்க அடுத்த வார்த்தையை நிகழ்தகவின் அடிப்படையில் கண்டுபிடிக்கிறது. இப்படி வார்த்தைகளை கோர்த்துக் கொண்டு செல்கிறது. மொழியின் இலக்கணம் என்ற லாஜிக்கையும் கூடவே பயன்படுத்துகிறது. யோசித்துப் பார்த்தால் நாமும் அப்படிதான் பேசுவோம். ஆனால் நம் மூளைக்குள் நாம் எதையெல்லாம் வாசித்து, கேள்விப்பட்டு, பார்த்து உள்ளே செலுத்தியிருக்கிறோமோ அவற்றிலிருந்துதான் நம் பதிலைத் தேர்வு செய்ய முடியும். வெள்ளத்தனைய மலர் நீட்டம். இந்த ஏஐ-க்குள் மொத்த இன்டர்நெட்டே இருக்கிறது. அதனால் அவற்றால் நிகழ்தகவின் அடிப்படையில் வார்த்தைகளை (அதன் மூலம் தகவல்களை) அடுக்கிக் கொண்டே செல்லமுடிகிறது.

மானே, தேனே, பொன்மானே என்று இதற்குள் பல இருந்தாலும் நிகழ்தகவும், மனித மொழிகளின் லாஜிக்கும்தான் இன்றைய ஏஐ-களின் அடிப்படை. சில சமயங்களில் இந்த நிகழ்தகவு வெற்று நிகழ்தகவாகிவிடும். முதல் பத்தியில் நான் எழுதிய கோச்சடையான் கட்டுரை போல. அதை வாசிக்கும் மனிதருக்கு அதைப்பற்றிய அறிவில்லாத பட்சத்தில் அவருக்கு அது உண்மையாகவே தோன்றும். ஏனென்றால் அதன் மொழிக்கட்டமைப்பு, லாஜிக் இரண்டும் சரியாக இருக்கும். இதை ஏஜ ஹாலூசினேஷன் என்கிறார்கள். 

இதை வைத்துக் கொண்டு நம் புலவர்கள் அந்த காலத்திலேயே ஏஐ-யை உபயோகித்து சில குறுந்தொகைப் பாடல்களை எழுதியிருக்கிறார்கள் என்று கதைவிட நான் ரெடி (இல்லை…

JK