मेटा के नए स्पीच-टू-टेक्स्ट एआई मॉडल्स 1,600 भाषाओं को कवर करते हैं, जिसमें दुर्लभ भारतीय बोलियाँ भी शामिल हैं
मेटा की फंडामेंटल एआई रिसर्च (FAIR) टीम ने ओम्नीलिंगुअल ऑटोमैटिक स्पीच रिकग्निशन (ASR) नामक एक क्रांतिकारी ओपन-सोर्स सिस्टम लॉन्च किया है, जो 1,600 से अधिक भाषाओं में स्पीच-टू-टेक्स्ट ट्रांसक्रिप्शन प्रदान करता है। इसमें 500 से अधिक कम संसाधन वाली भाषाएँ शामिल हैं, जो पहले कभी एआई द्वारा ट्रांसक्राइब नहीं की गईं। भारतीय संदर्भ में, यह मॉडल हिंदी, मराठी, मलयालम, तेलुगु, ओडिया, पंजाबी, उर्दू के अलावा दुर्लभ बोलियों जैसे कुई, छत्तीसगढ़ी, मैथिली, बघेली, महासू पहाड़ी, अवधी और राजबंशी को भी सपोर्ट करता है। यह 7-बिलियन पैरामीटर वाला मॉडल विविध एक्सेंट्स, डायलेक्ट्स और स्पीच पैटर्न्स पर ट्रेन किया गया है, जिसकी चरित्र एरर रेट (CER) 78% भाषाओं में 10% से कम है। मेटा ने मोज़िला फाउंडेशन के कॉमन वॉइस और लैनफ्रिका जैसे पार्टनर्स के साथ 350 कम संसाधन वाली भाषाओं का डेटासेट भी रिलीज़ किया है, जो एपाचे 2.0 लाइसेंस के तहत उपलब्ध है। यह कदम वैश्विक एआई समावेशिता को बढ़ावा देता है, खासकर भारत में मिशन भाषिणी जैसी पहलों के साथ तालमेल बिठाते हुए।
- 350 कम संसाधन भाषाओं का नया डेटासेट
- मोज़िला कॉमन वॉइस और लैनफ्रिका के साथ साझेदारी
भारत सरकार की ‘मिशन भाषिणी’ से तालमेल