அறிவியலின் அடுத்த பாய்ச்சல்: செயற்கை நுண்ணறிவு - Viduthalai

சுடச்சுட

Viduthalai

உலகின் ஒரே பகுத்தறிவு தமிழ் நாளேடு.The World's only Tamil Rationalist daily.

Saturday, April 15, 2023

அறிவியலின் அடுத்த பாய்ச்சல்: செயற்கை நுண்ணறிவு

வினோத் ஆறுமுகம்

கடந்த சில மாதங்களாக உலகம் முழுவதும் ஆச்சரியத்தில் மூழ்கி வருகிறது. ஒரு கணினி மென்பொருள் நாம் கேட்கும் கேள்விகளுக்கு அட்டகாசமாகப் பதில் அளித்தது. கவிதை எழுதியது, கட்டுரை எழுதியது. கேட்ட கேள்விகளுக்குப் பதிலை உருவாக்கித் தந்தது. மாணவர்களின் வீட்டு பாடங்களை மிக எளிதாகச் செய்து கொடுத்தது. அது தான் ChatGPT எனும் செயற்கை நுண்ணறிவு  (Artificial Intelligence)    மென்பொருள். Chat என்றால் அரட்டை.

மனிதர்களுடன் அரட்டை அடிக்கும் மென்பொருள்

ஆனால் பரபரப்பு அடங்கவில்லை, சாட் ஜி.பி.டி கல்லூரித் தேர்வுகள், வேலைக்கான நேர்முகத் தேர்வு கேள்விகளையும் மிக எளிதாகப் பதிலளித்துப் பரபரப்பில் பெட்ரோல் ஊற்றியது. மைக்ரோசாப்ட் நிறுவனம் உடனே 10 பில்லியின் டாலர் முதலீடு செய்து தங்கள் பிங் எனும் தேடுபொறியுடன் இணைத்துக்கொள்ள ஒப்பந்தம் செய்தார்கள். உலகின் முதல் தேடுபொறி தளமான கூகுளுக்கு செக்மேட் வைத்தார்கள். 

எல்லாம் சரி சாட்ஜிபிடி என்றால் என்ன?

செயற்கை நுண்ணறிவு கொண்ட எந்திரங்களை (ரோபோட்) உருவாக்க வேண்டும் என்பது மனிதனின் பெருங்கனவு. கணினிகள் வந்த புதிதில் மனிதனைப் போலவே சிந்திக்கும் கணினிகளை உருவாக்கலாம் என்ற எண்ணத்தை ஜான் மெக்கார்த்தியும் மார்வின் மின்ஸ்கியும் முன் வைத்தார்கள். ஜான் மெக்கார்த்தியைச் செயற்கை நுண்ணறிவின் தந்தை என்றழைப்பார்கள். ஆனால் கணிதச் சாத்தியங்கள், அப்போதைய கணினி எந்திரங்களின் போதாமையால் செயற்கை நுண்ணறிவு கனவாகவே இருந்தது.

செயற்கை நுண்ணறிவின் ஒரு பகுதி ஆய்வுகள் மொழியைப் பற்றியவை. இவற்றை Natural Language Processing (AI NLP) என்றழைப்பார்கள். இதன் ஆய்வுகள் மனித மொழியைப் புரிந்து அதே மொழியில் பதிலளிப்பது. மனித மொழியை எழுத்து மூலமாகவும், ஒலி மூலமாகவும் புரிந்து கொள்வது. ஒருவரின் மொழியைப் புரிந்துகொண்டு சரியாக அதற்குப் பதிலளித்தால் மிகப் பெரும் சாதனை. அத்தகைய கணினி (மென்பொருள்)யைக் கொண்டு மொழி பெயர்ப்புகளை எளிதானதாகவும், வேகமாகவும், சிறப்பாகவும் செய்யலாம். உலகம் முழுவதும் மொழி சிக்கலை ஒழித்துவிடலாம். பெருங்கனவு.

ரஷ்யாவிற்கும் அமெரிக்காவிற்கும் பனிப்போர் நடந்த காலகட்டத்தில், இப்படியான ஒரு கணினியை உருவாக்கிவிட்டால் ரஷ்ய- ஆங்கில மொழி பெயர்ப்பை எளிதாக்கிவிடலாம். இதனால் ரகசியமும் காக்கப்படும். இப்படிச் சொல்லித் தான் இதன் ஆய்வுகளுக்குப் பணம் பெற்றார்கள்.

இந்த ஆய்வுகளில் உருவாகியது தான் சாட்பாட் (ChatBot). பாட் என்பது ரோபாட்டை குறிக்கும். தாமாக மனிதர்களுடன் உரையாடும் பாட் என்று விளக்கினாலும். சாட் பாட்டுகள் மிக எளிதான தேடுதலை மட்டும் தான் செய்தது.

ஒரு நிறுவனத்தின் தரவுத்தளத்தில் ஏற்கெனவே  இருக்கும் கேள்விகளுக்கான பதிலை அப்படியே பெற்றுத் தரும். ஆனால் அந்தக் கேள்வியை புரிந்துகொள்ளாது. இப்போது கூட பல வங்கிச் சேவை வலைத்தளங்களில் இப்படியான தானியங்கி சாட் பாட்களை நீங்கள் எதிர்கொண்டிருக்கலாம். 

மனிதர்களிடம் இருந்து வரும் கேள்விகளை (Input) உள்வாங்கி அது என்னவென்று தெரிந்தால் தான் கணினியால் சரியான பதில் அளிக்க முடியும். அதைப் பற்றிய ஆய்வுகள் தொடங்கிய போது தான் செயற்கை நரம்பியல் அமைப்பு உருவானது.  (Artificial Neural Network).  மிகவும் சிக்கலான, பெரிய (இங்கு பெரிய என்பது பில்லியின் கணக்கான உள்ளீடுகளைப் பெற்றுக் கணிக்கும்) செயற்கை நரம்பியல் அமைப்பைக் கூகுள் நிறுவனம் உருவாக்கியது இதை Deep Mind என்றைழைப்பார்கள். இதைக் கொண்டு தான்  large Language models  உருவாக்கினார்கள். இந்த LLM தான் மனித மொழியைப் புரிந்து அரட்டை வடிவில் அவர்களுக்கு பதில் அளிக்கும். 

கூகுள் மாதிரியான தேடுபொறியில் ஒரு விதத்தில் நாம் கேட்கும் கேள்வியைப் பொறுத்து, நமக்குத் தேவையான வலைத்தளங்களைப் பட்டியலிடும். ஆனால் இன்றைய மக்கள் தேவை என்பது பதிலை உருவாக்க வேண்டும். “சென்னையைப் பற்றிச் சொல்” என்றால் தேடுபொறி சென்னையை பற்றிய கட்டுரைகள் கொண்ட வலைத்தளங்களை நமக்குக் காட்டும். ஆனால் இந்த  AI Chat bots  என்பவை கேள்விகளை உள்வாங்கி அவற்றுக்கான விடையை உங்களுக்கு உருவாக்கிக் கொடுப்பவை. இவை போன்ற மென்பொருட்களை generative AI  என்பார்கள். 

சாட்ஜிபிடி என்பது  ‘openai’ எனும் நிறுவனம் உருவாக்கியிருக்கும் செயற்கை நுண்ணறிவு கொண்ட ஓர் அரட்டை மென்பொருள்.

தற்போது ஆங்கிலத்தில் மட்டும் செயல்படுகிறது. தமிழை ஏற்றுக்கொண்டு பதிலளித்தாலும் மிகவும் சுமாராகத்தான்... இல்லை, இல்லை... நிறையப் பிழைகளுடன் தான் பதில் அளிக்கிறது.  ஆனால் ஆங்கிலத்தில் ‘ச்சும்மா” பிச்சு உதறுகிறது.

இணையத்தில் இருக்கும் பல லட்சம் தகவல்கள், கட்டுரைகளை உள்ளிடுவார்கள். பெறும் தகவல்களைப் பல்வேறு அல்காரிதங்கள் உதவியுடன், அதில் இருக்கும் ஒற்றுமைகள், பிரிவுகள் என இந்த மென்பொருள் ஒரு பட்டியல் தயாரிக்கும். இந்த ஒற்றுமைகளின் புள்ளியியல் ஒன்றை உருவாக்கும். அதன் அடிப்படையில் தான் இது பதிலளிக்கிறது.

எல்லா கேள்விகளுக்கும் பதில் அளிக்கிறதே என்று நாம் வியந்தாலும் இதில் ஆபத்தும் உள்ளது.

இவை போன்ற மென்பொருட்கள் மனிதனைப் போல புரிந்துகொள்வதில்லை; மாறாக சில கணிதங்களின் அடிப்படையி லேயே இயங்குகிறது. இதனால் இவற்றிலிருக்கும் உள்ளீடுகளைப் பொறுத்தே அதன் பதில் இருக்கும். ஒருவேளை “ஹிட்லர் நல்லவர்” என அதிகமாக உள்ளீடுகள் இருந்தால், அதை அப்படியே உள்வாங்கி “ஹிட்லர் நல்லவரா?” என்ற கேள்விக்கு ’ஆமாம்’ என்று பதிலளித்து விடும். இதை அந்த நிறுவனமே (சாட்ஜிபிடி) தன் முகப்பு பக்கத்தில் எச்சரிக்கையாகக் கொடுத்துள்ளது. 

இந்த மென்பொருள் pre-trained;  அதாவது ஏற்கெனவே  பயிற்றுவிக்கப்பட்டது. ஆனால் எப்படி பயிற்றுவிப்பார்கள்?

ஒரு வாதத்திற்கு இணையத்தில் இருக்கும் போலித் தகவல் தளங்களை அதிகம் உள்ளிட்டுவிட்டால், இது போலியான தகவலைத் தான் நமக்குக் கொடுக்கும்.  

இந்த சிக்கலைத் தீர்க்க இதன் அல்காரிதங்களை தொடர்ந்து மேம்படுத்திக்கொண்டே வர வேண்டும்.

வேலை வாய்ப்பு:

இதன் வருகை பல வேலை வாய்ப்பு களைப் பறிக்கும் என்று பொதுவாக ஓர் எண்ண ஓட்டம் உள்ளது. ஆனால் மொத்தமாக அனைவரையும் வீட்டில் உட்கார வைத்துவிடுமா என்றால் இல்லை, மாறாக வேறு தொழில்நுட்பம், திறன் சார்ந்த புதிய வேலைகளை உருவாக்கும். சாட்ஜிபிடி மனிதன் மேற்பார்வை இல்லாமல் இயங்கும் அளவு அதி திறன் பெறவில்லை. நிறுவனங்களின் மார்க்கெட்டிங் பிரிவுகள் பணம் சம்பாதிக்க இப்படியான பரபரப்புத் தகவலை வெளியிடுகிறார்கள். மனிதர்களின் தேவை இன்னும் அதிகமாகியுள்ளது. இதனால் பல புதிய வேலை வாய்ப்புகள் வரும். மிக விரைவில் சாட்ஜிபிடியின் அடுத்த மேம்படுத்தப்பட்ட மென்பொருள் வரப்போகிறது அதை GPT4 என்றைழைப் பார்கள். இது நாள் வரை இதன் உள்ளீடு சொல் மட்டும் தான். சொற்களை உள்ளீ டாகக் கொடுக்கலாம். ஆனால் GPT4ல் சொற் களுக்குப் பதில் படங்களை உள்ளீடாகக் கொடுக்கலாம்.

உங்கள் பிரிட்ஜில் இருக்கும் காய்கறி களின் படத்தை உள்ளிட்டால், அதை வைத்து என்ன சமைக்கலாம் என ஆலோச னைகளை GPT4 கொடுக்கும். 

ஆனால் இத்தாலி போன்ற பல நாடுகள் சாட்ஜிபிடியை தடை செய்துள்ளன. மக்க ளின் தகவல் பாதுகாப்பு முதல் சிக்கல்; அடுத்து சாட் ஜிபிடியில் சிறுவர்களின் வயதைப் பரிசோதிக்கும் முறை இல்லை. ஒருவேளை சிறுவர்கள் வயதுக்கு மீறிய  தகவலைக் கேட்டால் அது கொடுத்துவிடும். இதனால் இத்தாலி அரசு தடை செய்துள்ளது.

என்ன இருந்தாலும் என்ன? மக்கள் வியந்து போய் இருக்கிறார்கள். அதனால் மைக்ரோசாப்ட் வேகவேகமாகச் செயல் படுகிறது. மறு புறம் கூகுள் நிறுவனம் இந்த போட்டியைச் சமாளிக்க முடியாமல் திணறுகிறது என்பது குறிப்பிடத்தக்கது.

சாட் ஜிபிடி மட்டுமல்ல; செயற்கை நுண்ணறிவு தொழில்நுட்பத்தைக் கொண்டு அடுத்தடுத்து ஏராளமான புதிய செயலிகள், இணையதளங்கள் வந்த வண்ணம் உள்ளன. ஓவியம், ஒளிப்படத் திருத்தம், காணொளி உருவாக்கம் என்று மிரளவைத்துக் கொண்டிருக்கிறது இத் தொழில்நுட்பம். மனித குல வரலாற்றில் கணினி நிகழ்த்தியதை விட கூடுதலான பாய்ச்சலை, பாதை மாற்றத்தை செயற்கை நுண்ணறிவு நிகழ்த்தும்.

No comments:

Post a Comment