Friday, October 28, 2022

மெட்டாவின் புதிய கண்டுபிடிப்பு AI ஐப் பற்றிய ஒரு பார்வை...

 AI ஐப் பயன்படுத்தி மொழி மூலம் மக்கள் இணைவதற்கான புதிய வழியை மெட்டா உருவாக்குகிறது


செயற்கை நுண்ணறிவு பேச்சு மொழி பெயர்ப்பு அமைப்பு, பேச்சு மொழியான Hokkien ஐப் புரிந்துகொள்ள முடியும்.


மெட்டா ஒரு புதிய பேச்சு மொழிபெயர்ப்பாளரை உருவாக்கியுள்ளது, இது சீனாவின் புலம்பெயர்ந்த மக்களில் பேசப்படும் முக்கியமாக வாய்மொழி மற்றும் தைவானின் தேசிய மொழிகளில் ஒன்றான ஹொக்கியனை மொழிபெயர்க்க முடியும்.


பேசும் மொழி

Hokkien மில்லியன் கணக்கான மக்களால் பேசப்படும் வாய்மொழியாக இருப்பதால், இது ஒரு பெரிய திருப்புமுனையாகும்.


செயற்கை நுண்ணறிவு (AI) மொழிபெயர்ப்புகள் முக்கியமாக எழுதப்பட்ட மொழிகளில் கவனம் செலுத்துகின்றன. இருப்பினும், உலகின் தோராயமான 7,000 வாழும் மொழிகளில் கிட்டத்தட்ட பாதி முக்கியமாக பேசப்படும் மொழிகளாகும். இது பெரும்பாலான AI ஆல் மொழிபெயர்க்கப்பட்டபோது 3,500 மொழிகளைக் கணக்கிடவில்லை. Meta AI-இயங்கும் பேச்சு மொழிபெயர்ப்பாளரே முதல் வகை. முதன்மையாக வாய்மொழிக்கு பயன்படுத்தக்கூடிய முதல் AI மொழிபெயர்ப்பாளர் இதுவாகும், இந்த விஷயத்தில் Hokkien.


செயல்முறை எவ்வாறு செயல்படுகிறது

பெரும்பாலான சந்தர்ப்பங்களில், AI உரைபெயர்ப்பாளர்களைப் பயிற்றுவிப்பதற்காக, ஆராய்ச்சியாளர்கள் கணினி அமைப்பில் எழுதப்பட்ட மொழித் தகவலிலிருந்து தரவை உள்ளிடுவார்கள் மற்றும் AI அந்த செயல்முறையின் மூலம் வழக்கமான பேச்சைக் கற்றுக் கொள்ளும். இருப்பினும், Hokkien போன்ற வாய்மொழி மொழிகளில், எழுதப்பட்ட அமைப்பு இல்லாததால், மென்பொருளில் உள்ளிடுவதற்கு போதுமான தரவு இல்லை.


இன்று பயன்படுத்தப்படும் தற்போதைய பேச்சு மொழிபெயர்ப்பு அமைப்புகள் பேச்சு முதல் உரை அமைப்புகளை நம்பியுள்ளன. இருப்பினும், வாய்மொழியில் படியெடுத்த நூல்கள் இல்லை. எனவே, நிறுவனம் ஒரு புதிய பேச்சு-க்கு-பேச்சு மொழிபெயர்ப்பை உருவாக்கியது.


"முன்பு மெட்டாவால் முன்னோடியாக இருந்த பாதையில் உள்ள ஒலி அலகுகளின் வரிசைக்கு உள்ளீட்டு பேச்சை நேரடியாக மொழிபெயர்க்க பேச்சு-க்கு-அலகு மொழிபெயர்ப்பை (S2UT) பயன்படுத்தினோம்" என்று நிறுவனம் தனது வலைப்பதிவு இடுகையில், பேச்சு-க்கு-பேச்சு குறித்த தனது கடந்தகால ஆராய்ச்சியைக் குறிப்பிடுகிறது. மொழிபெயர்ப்பு முயற்சிகள். "பின்னர், நாங்கள் அலகுகளிலிருந்து அலைவடிவங்களை உருவாக்கினோம். கூடுதலாக, யூனிட்டி இரண்டு-பாஸ் டிகோடிங் பொறிமுறைக்காக ஏற்றுக்கொள்ளப்பட்டது, அங்கு முதல்-பாஸ் டிகோடர் தொடர்புடைய மொழியில் (மாண்டரின்) உரையை உருவாக்குகிறது மற்றும் இரண்டாவது-பாஸ் டிகோடர் அலகுகளை உருவாக்குகிறது," என்று அது கூறியது.


புதிய பேச்சு மொழிபெயர்ப்பாளர் திட்டம்

தற்போதுள்ள மொழிகளில் பேசப்படும் மொழிகளையும் உள்ளடக்கும் வகையில் புதிய பேச்சு-பேச்சு (S2ST) மொழிபெயர்ப்பு முறையை உருவாக்க மெட்டா முடிவு செய்தது. மெட்டாவின் திட்டத்தின் முக்கிய குறிக்கோள், பேசப்படும் மற்றும் எழுதப்பட்ட உலக மொழிகளில் பெரும்பாலானவற்றில் பயன்படுத்தக்கூடிய மொழி கருவிகளை உருவாக்குவதாகும். இந்த மொழிபெயர்ப்பு அமைப்பு மெட்டாவின் யுனிவர்சல் ஸ்பீச் டிரான்ஸ்லேட்டர் (யுஎஸ்டி) திட்டத்தின் ஒரு பகுதியாகும். எழுதப்பட்ட அல்லது பேசப்படும் மொழி அல்லது இரண்டையும் பொருட்படுத்தாமல் ஒரு மொழியில் பேச்சை மற்றொரு மொழியில் மொழிபெயர்க்க UST புதிய அணுகுமுறைகளை உருவாக்குகிறது. இந்த செயல்முறை அதன் ஆரம்ப கட்டத்தில் இருந்தாலும், அனைத்து வாய்மொழி மற்றும் எழுத்து மொழிகளையும் மொழிபெயர்ப்பதற்கான உலகளாவிய இலக்கை அடைவதற்கான சரியான திசையில் இது ஒரு படி என்று நிறுவனம் நம்புகிறது.


"உலகெங்கிலும் உள்ள அனைவருக்கும் உண்மையிலேயே உலகளாவிய மொழிபெயர்ப்பு கருவிகளை வழங்குவதற்கு அதிக வேலை தேவைப்படும். ஆனால் இங்கு விவரிக்கப்பட்டுள்ள முயற்சிகள் ஒரு முக்கியமான முன்னேற்றம் என்று நாங்கள் நம்புகிறோம்" என்று நிறுவனம் கூறியது.


இந்தத் திட்டப்பணியின் ஒரு பகுதியில் Meta's No Language Left Behind என்பதும் அடங்கும். திட்டத்தின் இந்தப் பிரிவுக்காக, நிறுவனம் ஒரு புதிய மேம்பட்ட AI மாதிரியை உருவாக்கி வருகிறது, இது பயிற்சியளிக்க நிறைய எடுத்துக்காட்டுகள் இல்லாத மொழிகளைக் கற்க முடியும், இதனால் குறைவாக அறியப்பட்ட மொழிகளையும் மொழிபெயர்க்க முடியும்.


அனைத்து மொழிகளையும் மொழிபெயர்ப்பதில் உள்ள சவால்கள்

ஒவ்வொரு மொழியிலும் மொழிபெயர்ப்பதில் மெட்டா தனது கவலைகளை குறிப்பிட்டுள்ளது. உலகளாவிய AI மொழி மொழிபெயர்ப்பாளரை உருவாக்குவதற்கு மேலும் செல்லும் போது அது எதிர்கொள்ளும் மூன்று சவால்களை அது குறிப்பிட்டுள்ளது. குறிப்பிடப்பட்ட முதல் சவால் தரவு பற்றாக்குறை. மெட்டா, எழுதப்பட்ட மொழிகளுக்குக் கூட, தரவுகளின் பற்றாக்குறை மிகவும் கடினம் என்பதை விளக்கியது, ஆனால் வாய்மொழி மொழிகளுக்கு இதை விரிவுபடுத்துகிறது, இது அதன் பேச்சு-க்கு-பேச்சு மொழிபெயர்ப்பை மேம்படுத்தும்.


குறிப்பிடப்பட்ட இரண்டாவது சவால் என்னவென்றால், பெரும்பாலான மொழிபெயர்ப்பு அமைப்புகள் ஆங்கிலம் மற்றும் ஸ்பானிஷ் போன்ற மொழிகளைப் புரிந்துகொள்ள இருமொழிகளாக வடிவமைக்கப்பட்டுள்ளன. பேசும் மொழியை விளக்குவதற்கு, பேசும் மற்றும் எழுதப்பட்ட மொழிகளைச் சேர்க்க டஜன் கணக்கான மொழி ஜோடிகளை அளவிட வேண்டும் என்று நிறுவனம் கூறியது.


சில வாக்கியங்கள் எழுதப்பட்ட விதத்தை விட வித்தியாசமான வார்த்தை வரிசையில் பேசப்படுவதால், நிகழ்நேர பேச்சு-பேச்சுக்கு மொழிகளை மொழிபெயர்ப்பது மூன்றாவது சவால்.


"தரவு சேகரிப்பு, மாதிரி வடிவமைப்பு மற்றும் மதிப்பீடு உள்ளிட்ட பாரம்பரிய இயந்திர மொழிபெயர்ப்பு அமைப்புகளை" உள்ளடக்கிய இந்த அமைப்பை உருவாக்குவதில் உள்ள கூடுதல் சவால்களை Meta AI ஆராய்ச்சியாளர்கள் குறிப்பிட்டுள்ளனர்.


பேசும் மொழிகளை மொழிபெயர்ப்பதன் எதிர்காலம்

தற்போது, ​​AI மொழிபெயர்ப்பாளரால் Hokkien மற்றும் ஆங்கிலம் இடையே உள்ள மொழிகளை மட்டுமே விளக்க முடியும், ஆனால் நிறுவனம் இந்த புதுமையான மொழியாக்க தொழில்நுட்பத்தை பிற மொழிகளுக்குப் பயன்படுத்துவதில் முடிவற்ற சாத்தியங்களைக் காண்கிறது. எதிர்காலத்தில் மற்ற பேச்சு வழக்குகளை மொழிபெயர்க்கும் திறனைப் பெறலாம் என்று நிறுவனம் நம்புகிறது. "நாங்கள் எங்கள் Hokkien மொழிபெயர்ப்பு மாதிரிகள் மட்டுமல்ல, மதிப்பீட்டு தரவுத்தொகுப்புகள் மற்றும் ஆய்வுக் கட்டுரைகளையும் திறந்த மூலப்பொருளாகக் கொண்டுள்ளோம், இதனால் மற்றவர்கள் எங்கள் வேலையைப் பெருக்கி உருவாக்க முடியும்" என்று மெட்டா கூறினார்.


மொழி தடைகளை உடைத்து, எதிர்காலத்தில் மொழி மூலம் ஒன்றுபட்ட உலகை உருவாக்க AI ஆராய்ச்சியைப் பயன்படுத்த நிறுவனம் விரும்புகிறது.


SHARE THIS

Author:

உங்களுக்கு பிடித்த சமீபத்திய செய்திகள், அழகு குறிப்புகள், அறிவியல், ஆரோக்கியம், ஆன்மிகம், உறவு, சமையல் குறிப்புகள், தொழிநுட்பம், மூலிகைகள், வாழ்க்கை முறை, வாழ்க்கை வரலாறு, மற்றும் பாலிவுட், கோலிவுட் நடிகையின் சமீபத்திய புகைப்படங்கள், செய்திகள், விடீயோக்கள் இங்கே காணலாம்.

0 comments: