வேர்களைத்தேடி தளத்திற்குத் தங்களை அன்புடன் வரவேற்கிறேன்... இத்தளத்தில் சங்க இலக்கியம், கணினித்தமிழ் சார்ந்து எனது அனுபவங்களைப் பகிர்ந்து வருகிறேன். 13 ஆண்டுகளில் 1500க்கும் மேற்பட்ட பதிவுகளை வழங்கியுள்ளேன். தற்போது இந்தியக் குடிமைப் பணித்தேர்வுக்கான விருப்பப் பாடம் தமிழுக்குரிய விளக்கங்களைத் தொடர்ந்து வழங்கி வருகிறேன். தங்கள் மேலான வருகைக்கு நன்றிகளைத் தெரிவித்துக்கொள்கிறேன்.

சனி, 18 நவம்பர், 2017

செயற்கை நுண்ணறிவுத்திறனும், தமிழ் கற்றல்,கற்பித்தல் நுட்பங்களும்

கனடாவில் 7-9 அக்டோபர் 2017 நடைபெற்ற இணைய மாநாட்டில் வழங்கிய கட்டுரை......

                                         
     மனிதர்களின் அறிவை இயற்கையான அறிவு, செயற்கையான அறிவு என வகைப்படுத்த இயலும். குலவித்தை கற்றுப் பாதி, கல்லாமற் பாதி என்ற பழமொழி கூட இக்கருத்தையே எடுத்துரைக்கிறது. இதையே வழக்கில் தன்னறிவு, சொல்லறிவு எனவும் கூறுவதுண்டு. மனிதர்களுக்கு எப்படி கல்வி என்ற முறை செயற்கையாக தம் அறிவை வளர்த்துக்கொள்ள உதவுகிறதோ அதுபோல,  கணினி  அல்லது  இயந்திரங்கள்  ஆகியவற்றை வைத்துக்கொண்டு அவற்றுக்குக் கற்பித்தல் வழியாக நுண்ணறிவை உருவாக்குகின்ற முறையே செயற்கை நுண்ணறிவுத்திறன் (Artificial Intelligence) என்று அழைக்கப்படுகிறது. மனிதர்களுக்கு ஒத்த அல்லது மனிதர்களைவிட அறிவுத்திறன் கொண்ட கணிப்பொறிகளை உருவாக்குவதே இத்துறையின் நோக்கம்வளர்ந்துவரும் செயற்கை நுண்ணறிவு நுட்பத்தின் வழி தமிழ்மொழியைக் கற்றல், கற்பித்தல் குறித்த ஆய்வாக இக்கட்டுரை அமைகிறது.
ஏஐ தொழில்நுட்பத்தின் தாக்கம்
           ஏஐ தொழில்நுட்பத்தின் வளர்ச்சியால் 2020-ம் ஆண்டு 50 லட்சம் வேலை இழப்புகள் ஏற்படலாம் என கடந்த ஆண்டு ஆய்வுகளும் வெளிவந்தன. 2030-ம் ஆண்டில் சர்வதேச பொருளாதாரத்தில் ஏஐ நுட்பத்தின் பங்கு 15.7 டிரில்லியன் டாலராக இருக்கும் என்று பிடபிள்யூசி நிறுவனம் தனது ஆய்வில் சுட்டிக் காட்டியுள்ளது. மேலும் 6.6 டிரில்லியன் டாலர் மதிப்புக்கு உற்பத்தி அதிகரிக்கும் என்றும் ஏஐ தொடர்பான வேலை வாய்ப்புகளும் அதிகரிக்கும் என்றும் அந்த ஆய்வில் கூறப்பட்டுள்ளது. மைக்ரோசாப்ட், கூகுள், ஐபிஎம், ஃபேஸ்புக், ஜெனரல் எலெக்ட்ரிக், அமேசான், ஆப்பிள் போன்ற நிறுவனங்கள் தற்போது இந்த தொழில்நுட்பம் குறித்த ஆய்வில் ஈடுபட்டு வருகின்றன. இந்த ஏஐ தொழில்நுட்பத்தின் தாக்கம் எல்லாத்துறைகளிலும் இருக்கும் என்பதால் இத்தொழில்நுட்பமானது தமிழ் மொழியில் எந்த அளவு பயன்படுகிறது, என்பதை அறிந்து எதிர்காலத்தில் இத்தொழில்நுட்பத்துக்கு ஏற்ப நாம் நம் தமிழ் மொழியின் நுட்பங்களை வளர்த்துக்கொள்வது நம் கடமையாகவுள்ளது.
கணினிக்கு தமிழ் கற்பித்தல்
      இயங்குதளம் முதல் இணையம் வரை வன்பொருள், மென்பொருள் என பல்வேறு நிலைகளில் தமிழ் எழுத்துருச் சிக்கல் பெரிதாக இருந்தது. ஒருங்குறி அதற்கு நல்ல தீர்வாக அமைந்தது. இன்று, சொற்பிழை திருத்தி, சந்திப்பிழை திருத்தி, இலக்கண பிழை திருத்தி, வட்டார வழக்கு பயிற்றுவித்தல், எந்திர மொழிபெயர்ப்பு நுட்பங்கள்,  எழுத்துக்களைப் பேச்சாகவும், பேச்சை எழுத்தாகவும் மாற்றுதல், ஒளி எழுத்துணரி (OCR), இயற்கை மொழி ஆய்வு (Natural Language Processing) செயற்கை நியுரல் கட்டமைப்புகள், (Artificial Neural networks) ஆழக் கற்றல்     (Deep Learning) வரை பல்வேறு நுட்பங்கள் கணினிக்குக் கற்பிக்கப்பட்டு வருகின்றன. வளர்ந்துவரும் ஒவ்வொரு நுட்பங்களுக்கும் ஏற்ப தமிழ் மொழியை நாம் தகவமைத்துக்கொள்ளவேண்டும். அதற்கான கலைச்சொல் வளங்களை உருவாக்கவேண்டும். தமிழ் வழி நிரலாக்கம் சராசரி மக்களின் பயன்பாட்டுக்கும் வரவேண்டும்.
கணினி வழி தமிழ் கற்றலும், கற்பித்தலும்
      குழந்தைகளுக்கான அடிப்படைத்தமிழ் தொடங்கி தமிழாய்வு வரை கணினி வழி தமிழ் கற்பதற்கான வழிமுறைகளையும், எழுத்து, ஒலி, ஒளி என பல்வேறு வடிவங்களில் கணினி, இணையம், மென்பொருள், குறுஞ்செயலிகள் போன்றவற்றில் தமிழ் கற்பதற்கான சூழல்களை உருவாக்கவேண்டும். மேலும் கணினியில் நழுவம் தொடங்கி தோற்றமெய்மை (Virtual reality) வரை தமிழ் கற்பித்தலுக்கான வாய்ப்புகள் உள்ளன. வலைப்பதிவு, சமூகத்தளங்கள் என காலத்துக்கு ஏற்ப வகுப்பறைகளைக் கடந்து மாணவர்களுடன் ஆசிரியர்கள் தொடர்பில் இருக்கும் நிலை உருவாகியுள்ளது. இந்நிலையில் தமிழ் கற்றல் கற்பித்தலுக்குக் கணினியை சரியாகப் பயன்படுத்தினால்  உலகுபரவி வாழும் தமிழர்களும் அடுத்த தலைமுறையினருக்குக்கும் தமிழைக் கொண்டு சேர்க்கமுடியும்.
தமிழ் கற்றல், கற்பித்தலில் மனிதனும் ஏஐ நுட்பமும்
     தமிழ் கற்றல் என்பது குழந்தைகள் முதல் வயதானவர்கள் வரை நடைபெற்றாலும், உள்நாடு, வெளிநாடு எனவும் தமிழைத் தாய்மொழியாகக் கொண்டவர்கள், பிறமொழியைத் தாய்மொழியாகக் கொண்டவர்கள் என்ற நிலையிலும் தமிழ் பேச மட்டுமே தெரிந்தவர்கள், எழுத்து வடிவத்தை அறியாதவர்கள் எனவும் தமிழ் கற்போர் பல வகையில் உள்ளனர். இந்நிலையில் தமிழ் கற்றல், கற்பித்தல் என்பது கணினி மனிதனிடம், மனிதன் கணினியிடம்  என இரு நிலைகளில் நிகழ்கிறது. அறிவு, அனுபவ அறிவு, பொது அறிவு, நினைவுத்திறன், செயல்திறன், உணர்வுகளைக் கையாளும் திறன் என பல்வேறு செயல்பாடுகள் மனிதனை அடிப்படையாகக் கொண்டு கணினிக்குக் கற்பிக்கப்பட்டு வருகின்றன.
ஐ.கியு + இ.கியு = ஏ.ஐ (IQ + EQ = AI)
            Intelligence quotient என்ற சொல்லை நுண்ணறிவு என்றும், சுருக்கமாக அதை IQ என்றும் அழைக்கிறோம். அதுபோல Emotional Intelligence என்ற சொல் உணர்வுகளை கையாளும் அறிவைக் குறிப்பதாக அமைகிறது. அதைச் சுருக்கமாக  EQ என அழைக்கிறோம். Artificial Intelligence என்ற சொல்லை,  செயற்கை நுண்ணறிவு என்றும் AI என்றும் அழைக்கிறோம். இன்று மனிதர்களின் நுண்ணறிவுத்திறனை அறிந்துகொள்ளப் பல இணையதளங்கள் உள்ளன. மனித உணர்ச்சிகளை கட்டுப்பாட்டுக்குள் வைத்துக்கொள்ள உளவியல் அடிப்படையில் பல புரிதல்கள் ஏற்பட்டுள்ளன. மனிதர்களின் இயற்கையான அறிவைக்கடந்து திறன்பேசி போன்ற பல நுட்பியல் கருவிகள் பயன்பாட்டுக்கு வந்துவிட்டன. இந்நிலையில் தேடுபொறி முதல் சமூகத்தளங்கள் வரை இணையத்திலும் சராசரி மக்களின் பயன்பாட்டிலுள்ள நுட்பியல் கருவிகளிலும் மனித நுண்ணறிவை அளவிடும் முறைகளும், உணர்வுகளை கையாளும் நுட்பங்களும் மேம்படுத்தப்படவேண்டிய நிலையிலேயே இருக்கின்றன. திறன்பேசி முதல் பல்வேறு நுட்பியல் கருவிகளிலும் இதனைக் கருத்தில்கொள்ளவேண்டும்.
மனிதன் -  ஏ.ஐ நுட்பம்
      கணினியும், இணையமும், மென்பொருள்களும், குறுஞ்செயலிகளும் மனிதனோடு கற்றல், கற்பித்தல் என்ற நிலைக்கு வந்துவிட்டன. இந்நிலையில் யுடியுப், கான் அகாடமி போன்ற காணொளி வழி கற்பித்தல், ஸ்மார்ட் கிளாஸ், வர்சுவல் கிளாஸ் என்றழைக்கப்படும் வகுப்பறைச் சூழல்கள் எல்லாம் நடைமுறைக்கு வந்துவிட்டன. சராசரி ஆசிரியரின் மொழியறிவு, பொது அறிவு, பொதுவான அறிவு, நினைவுத்திறன், கற்பனை வளம், ஒப்பீட்டு அறிவு, உவமை  ஆகியன ஏ.ஐ நுட்பியல் கருவிகளுக்குப் போதுமானதாகக் கற்பிக்கப்படவில்லை. கணினி வழி தமிழ் கற்பித்தலுக்கான வாய்ப்புகள் நிறைய உருவாக்கப்பட்டிருந்தாலும், கணினி, மனிதனிடம் கற்கவேண்டிய பண்புகள் நிறையவே உள்ளன.  
நிறைவாக..
·         மனிதர்களை ஒத்த அல்லது மனிதர்களைவிட அறிவுத்திறன் கொண்ட கணினிகளை  உருவாக்கும் நோக்குடன் வளர்ந்துவரும் துறையே ஏஐ என்றழைக்கப்படும் செயற்கை நுண்ணறிவுத்திறன் என்ற துறையாகும்.
·         ஏஐ நுட்பத்தால் இன்றைய சூழலில் கணினி முதல் கணினி சார்ந்த பல்வேறு நுட்பியல் கருவிகளும் திறன்மிக்கனவாகவும் அவரவர் மொழியிலும் பயன்படுத்த இயலும் என்ற சிறந்த வளர்ச்சி ஏற்பட்டுள்ளது. அதனால் இந்நுட்பத்தால் தமிழ் கற்றல் கற்பித்தலில் மிகப்பெரிய மாற்றம் ஏற்படவுள்ளது.
·         இயங்குதளம் முதல் இணையம் வரை வன்பொருள், மென்பொருள் சமகால பயன்பாடுகளில் ஏஐ என்ற நுட்பம் பெரும்பங்கு வகிக்கிறது. அதனால் கணினிக்கு தமிழ் கற்பித்தல் வழியாக தமிழ் மொழியின் பெருமையை மேலும் உலகறியச் செய்ய இயலும்.
·         சொற்பிழை திருத்தி, சந்திப்பிழை திருத்தி, இலக்கண பிழை திருத்தி, வட்டார வழக்கு பயிற்றுவித்தல், எந்திர மொழிபெயர்ப்பு நுட்பங்கள்,  எழுத்துக்களைப் பேச்சாகவும், பேச்சை எழுத்தாகவும் மாற்றுதல், ஒளி எழுத்துணரி (OCR), இயற்கை மொழி ஆய்வு (Natural Language Processing) செயற்கை நியுரல் கட்டமைப்புகள், (Artificial Neural networks) ஆழக் கற்றல்     (Deep Learning) என பல்வேறு முறைகளில் கணினிக்கு தமிழ் கற்பிக்கப்பட்டு வருகிறது.
·         மேலும் கணினி வழியாகத் தமிழ் கற்றல், கற்பித்தலுக்கான சிறப்பான களங்கள் உருவாகியுள்ளன. ஐ.கியு, இ.கியு, ஏ.ஐ, என்னும் அறிவு குறித்த தெளிவான புரிதல், செயற்கை நுண்ணறிவுத்திறன் வழி தமிழ் கற்றல் கற்பித்தல் குறித்த ஆய்வில் எதிர்காலத்தில் மிகச்சிறப்பான வளர்ச்சிக்கு அடிப்படையாக அமையும்.
·         கணினிக்குத் தேவையான தமிழ் மொழி அறிவை முறையாகக் கற்பித்தால் எதிர்காலத்தில் கணினிகளை மனிதனுக்கு மாற்றாக மட்டுமின்றி மனிதனுக்குப் போட்டியாகவும் உருவாக்கமுடியும்.

·         ஒருகாலத்தில் அஷ்டாவதானி, தசாவதானி, சதாவதானி என்று மனிதர்களின் திறமைகளைப் போற்றினோம். இன்று மனிதனுக்குப் போட்டியாக கணினிகள் பல்வேறு திறன்களுடன் வளர்ந்துவருகின்றன. இச்சூழலில், கணினிக்கு தமிழ் சார்ந்த பொது அறிவைக் கற்பிப்பது மிக எளிதாக உள்ளது. ஆனால் பொதுவான அறிவு அதாவது அதைக் கேட்பரின் திறனறிந்து எவ்வாறு சொல்வது என்ற அறிவைக் கணினிக்குக் கற்பிப்பது நம்முன் உள்ள மிகப்பெரிய இலக்காகவே உள்ளது.