ضمن الجهود الهادفة إلى بناء أول معيار علمي عالمي لتقويم النطق العربي على مستوى الفونيم، شارك باحثون من مختلف الدول في المهمة البحثية Iqra’Eval، التي قدمت دراسات متقدمة لتوظيف الذكاء الاصطناعي في كشف الأخطاء الفونيمية في التلاوة القرآنية.
من أبرزها تجربة الباحث أحمد إبراهيم من جامعة نيو ساوث ويلز (UNSW Sydney)، الحاصلة على المركز الثاني، والتي قدم فيها نظام Hafs2Vec المعتمد على نموذج Wav2Vec2-xls-r-1b من ميتا.
اعتمدت الدراسة على الدمج الذكي للبيانات (Data Mixing)، إذ تجمع بين بيانات المتعلمين والتلاوات الاحترافية لتحسين دقة النموذج، وطور الباحث أداة Qur’anic Phonemizer التي تولد تسلسلات فونيمية دقيقة تراعي قواعد التجويد مثل الإدغام، الإقلاب، الإخفاء، والقلقلة، وهي قواعد لا تراعيها المحللات الفونيمية القياسية للعربية الحديثة.
البيانات والتدريب
اعتمد النظام على دمج مجموعتين رئيسيتين:
- بيانات Iqra’Eval الرسمية (حوالي 79 ساعة تسجيل) التي تتضمن نطقًا عربيًا قياسيًا وتلاوات بقراءات مختلفة.
- تلاوات احترافية من 28 قارئًا من مصادر مثل EveryAyah وQur’anic Universal Library - Tarteel بإجمالي نحو 94 ساعة إضافية، ليصل المجموع إلى أكثر من 173 ساعة تدريب.
خلال عملية التدريب، استخدم الباحث نموذج Wav2Vec2-xls-r-1b متعدد اللغات، وضبطه عبر 15 دورة تدريبية باستخدام خوارزمية AdamW على حواسيب فائقة الأداء من جامعة UNSW، ليصبح قادرًا على التعرف على الفونيمات القرآنية وتمييز الأخطاء الدقيقة في النطق.
وعند اختبار النظام على مقياس QuranMB حقق درجة F1 بلغت 46.50%، واسترجاعًا مرتفعًا بنسبة 79.20%. وظهرت قدرة النموذج على التقاط معظم الأخطاء الفعلية في التلاوة، مع توازن جيد بين الكشف والتشخيص. كما تفوق أداء النموذج في النطق القرآني على أداءه في اللغة العربية الفصحى، بفضل حساسيته لقواعد التجويد وتمييزه بين أنماط التلاوة المختلفة (التحقيق، الترتيل، الحدر).
التوصيات
كشف التحليل أن أغلب الأخطاء التي واجهها النموذج كانت في الحركات الطويلة والقصيرة (بنسبة 63% من إجمالي الأخطاء)، نتيجة التشابه الصوتي الكبير بين المتغيرات مثل “a / aa” و“u / uu”.
كما أظهرت النتائج أن النموذج أصبح قادرًا على تمييز وجود التجويد من عدمه، فلم يُدخل أصواتًا تجويدية في التسجيلات الخالية من التجويد، ما يدل على وعي صوتي دقيق اكتسبه من توازن البيانات.
ويوصي الباحث أحمد إبراهيم بتوسيع العمل عبر:
- استكشاف نماذج أكبر (مثل Wav2Vec2-xls-r-2B) لتحسين تمثيل الفروقات الدقيقة بين الفونيمات
- معالجة ندرة الفونيمات النادرة مثل الشدّة عبر تقنيات التوازن في البيانات أو تعديل دوال الخسارة أثناء التدريب
- تطوير اختبارات معيارية خاصة بالتجويد، تراعي الأنماط المتعددة للتلاوة القرآنية