मेटा के नए स्पीच-टू-टेक्स्ट एआई मॉडल्स 1,600 भाषाओं को कवर करते हैं, जिसमें दुर्लभ भारतीय बोलियाँ भी शामिल हैं

मेटा की फंडामेंटल एआई रिसर्च (FAIR) टीम ने ओम्नीलिंगुअल ऑटोमैटिक स्पीच रिकग्निशन (ASR) नामक एक क्रांतिकारी ओपन-सोर्स सिस्टम लॉन्च किया है, जो 1,600 से अधिक भाषाओं में स्पीच-टू-टेक्स्ट ट्रांसक्रिप्शन प्रदान करता है। इसमें 500 से अधिक कम संसाधन वाली भाषाएँ शामिल हैं, जो पहले कभी एआई द्वारा ट्रांसक्राइब नहीं की गईं। भारतीय संदर्भ में, यह मॉडल हिंदी, मराठी, मलयालम, तेलुगु, ओडिया, पंजाबी, उर्दू के अलावा दुर्लभ बोलियों जैसे कुई, छत्तीसगढ़ी, मैथिली, बघेली, महासू पहाड़ी, अवधी और राजबंशी को भी सपोर्ट करता है। यह 7-बिलियन पैरामीटर वाला मॉडल विविध एक्सेंट्स, डायलेक्ट्स और स्पीच पैटर्न्स पर ट्रेन किया गया है, जिसकी चरित्र एरर रेट (CER) 78% भाषाओं में 10% से कम है। मेटा ने मोज़िला फाउंडेशन के कॉमन वॉइस और लैनफ्रिका जैसे पार्टनर्स के साथ 350 कम संसाधन वाली भाषाओं का डेटासेट भी रिलीज़ किया है, जो एपाचे 2.0 लाइसेंस के तहत उपलब्ध है। यह कदम वैश्विक एआई समावेशिता को बढ़ावा देता है, खासकर भारत में मिशन भाषिणी जैसी पहलों के साथ तालमेल बिठाते हुए।

Nov 11, 2025 - 19:42
मेटा के नए स्पीच-टू-टेक्स्ट एआई मॉडल्स 1,600 भाषाओं को कवर करते हैं, जिसमें दुर्लभ भारतीय बोलियाँ भी शामिल हैं
मेटा ने दुनिया की सबसे बड़ी ओम्नीलिंगुअल स्पीच-टू-टेक्स्ट तकनीक लॉन्च की है, जो 1,600 से ज़्यादा भाषाओं को सपोर्ट करती है। इसमें भारत की कई दुर्लभ बोलियाँ भी शामिल हैं, जो अब तक डिजिटल दुनिया से लगभग ग़ायब थीं।
एक मॉडल, 1,600 भाषाएँ – पहली बार इतना बड़ा कवरेज
मेटा की फंडामेंटल एआई रिसर्च (FAIR) टीम ने ओम्नीलिंगुअल ऑटोमैटिक स्पीच रिकग्निशन (ASR) सिस्टम पेश किया है। यह 7-बिलियन पैरामीटर वाला मॉडल है, जो 500 से ज़्यादा कम संसाधन वाली भाषाओं को पहली बार एआई के दायरे में लाता है।
    78% भाषाओं में चरित्र एरर रेट (CER) 10% से कम हिंदी, तमिल,
    बांग्ला से लेकर कुई, छत्तीसगढ़ी,
    अवधी तक विविध एक्सेंट्स, बोलचाल की शैली और क्षेत्रीय उच्चारण को समझता है
    भारत की ‘भूली-बिसरी’ बोलियाँ अब डिजिटल हो रही हैं
    भारत में 22 आधिकारिक भाषाएँ हैं, लेकिन लाखों लोग दुर्लभ बोलियाँ बोलते हैं। मेटा का मॉडल अब इन्हें भी पहचानता है:
    ओपन-सोर्स रिलीज़ – डेवलपर्स के लिए नया अवसर
    मेटा ने पूरा मॉडल एपाचे 2.0 लाइसेंस के तहत ओपन-सोर्स किया है। साथ में:
    • 350 कम संसाधन भाषाओं का नया डेटासेट
    • मोज़िला कॉमन वॉइस और लैनफ्रिका के साथ साझेदारी

            भारत सरकार की ‘मिशन भाषिणी’ से तालमेल

    मेटा का यह कदम सिर्फ़ तकनीकी नहीं, सामाजिक क्रांति है। जब कोई बुजुर्ग अवधी में बोलेगा और उसकी बात डिजिटल रिकॉर्ड में बदल जाएगी – यही है भाषाई समानता की नई शुरुआत
    The Khatak Office office team at The Khatak .