ما شاء الله تبارك الله، مشروع منجم جهد ضخم ومهم جدا، وشرحك للخطوات التقنية واضح ومفصل بشكل ممتاز.
يعني وفرتوا شهور للمطورين واصحاب المشاريع.
كمان الخوارزمية اللي بتدمج المقاطع المتعددة لتكوين آية كاملة، وطريقة معالجة الكلمات الأخيرة ونسبة التغطية لضمان اكتمال الآية قبل الانتقال للتالية. ده حل ذكي فعلا.
عندي اقتراح ممكن يفيد في تحسين الدقة:
ممكن تفكروا في إضافة confidence score لكل آية في المخرجات؟ يعني النظام يحسب درجة ثقة للمزامنة بناء على عوامل زي:
- نسبة التشابه بين النص المستخرج والنص المرجعي
- جودة اكتشاف الصمت
- طول المقطع مقارنة بالمتوقع
بالطريقة دي، المطورين هيقدروا يعرفوا الآيات اللي محتاجة مراجعة يدوية بسرعة، بدل ما يراجعوا المصحف كله. ممكن كمان يعملوا filtering للنتائج حسب الـ confidence threshold اللي محتاجينه لتطبيقهم.
شكرا على المشاركة وإتاحة المشروع open source، وبالتوفيق في التطوير القادم، إن شاء الله نشوف منجم يدعم كل القراءات العشر قريب.