كريم ابراهيم
شكراً أخي الكريم على المتابعة وعلى السؤال والمقترحات والتحليل المبهر ..
دعني أوضح لك أن الكشف عن السكتات هو أول خطوة في الخوارزمية لكنها خطوة غير معتبرة بمعنى أننا نستخدمها لتسريع المعالجة لكنها ليست هي الأصل .. أما النموذج التابع لترتيل نعم فإن جودته ليست الأعلى وليست كافية للعمل الوسم الدقيق، إذا كيف عالجنا ذلك؟
لقد اعتمدنا مقارنة كلمة كلمة مع نص القرآن المقسم بالآية وبشكل إحصائي تقريبي نقوم بربط الاحتمالات على مستوى مجموعات من الكلمات وليس كلمة كلمة .. بمعنى أن دقة النموذج نعم ليست الأفضل لكننا نستخدم المقاربة والمقارنة بمجموعة من الكلمات وذلك من خلال تحليل إحصائي في نهاية كل آية بمقارنة آخر كلمتين أو ثلاث كلمات .. لكن كان هناك تحدٍ آخر وهو التقاطع في التلاوات المجودة .. حيث أن التلاوة المجودة يعيد القاريء فيها جزء من الآية السابقة مع بداية الآية الجديدة .. لذلك الفصل بين الآيات كان مشكل جداً لاننا نحل مشكلتين في آن واحد المشكلة الأولى هي عدم دقة محاذاة الكلمة بالكلمة ومشكلة تقاطع مقاطع الآيات بسبب التكرار في تلاوات التجويد .. وعليه حللنا التقاطعات وحددنا النمط ثم قمنا بمعالجة التقاطعات لنصل لجودة تصل ل٩٥٪ في محاذاة الآية بالآية .. الآية الصويتية أي التلاوة والآية المكتوبة أي النص القرآني (المقسم بالآية) ..
لماذا أذكر شكل تقسيم النص القرآني ..
الحقيقة أن هناك نصوص قرآن مقسمة بالكلمة ولكن استخدامنا للنص المقسم بالآية هو ما جعل كل ذلك ممكن .. أي أن منجم لم يكن ليكون ممكناً إلا بوجود هذه البيانات المقسمة بالآية .. لاننا لا نستطيع بالجودة الحالية لنموذج ترتيل أن نحاذي الكلمة بالكلمة ..
المسار لمحاذاة الكلمة بالكلمة يحتاج شيئاً من إثنين أو كلاهما لضمان جودة تامة:
- تحليل إحصائي أعقد لحصر حدود الكلمات باستخدام الفصل بحركات الصوت (أي بالتشكيل ومخارج الحروف).
- تحسين جودة النموذج ومقارنة البيانات الصوتية أي التلاوات بنص قرآني مقسم بالكلمة و وسم البيانات على مستوى الكلمة.
أما بصدد اعتمادنا على السكتات فأشكرك كثيراً لإثارة النقطة الخاصة الشوائب الصوتية .. فوجود شوائب يلغي السكتات ولذلك الحل المقترح هو إضافة خطوة إزالة الشوائب من خلال نموذج يحسن جودة الصوت .. ولكن هذا يحتاج لدراسة وتجارب حيث أن إزالة الشوائب هو مهمة متخصصي علم معالجة الصوت وهذا لا يكون إلا بإشراف متخصص (مهندس صوت دارس) بالتعاون مع مهندس ذكاء إصطناعي .. لدينا بعض المرشحين ولكن لا نعلم مدى قابليتهم .. فنحتاج للعمل على اختيار كوادر للعمل على هذه المسائل. والسبب في أننا من وجهة نظرنا لا يجب أن نتخلى عن المعالجة بالسكتات كأول خطوة هو الآداء حيث أن تلك الخطوة تضمن وتوفر الكثير من الوقت والدقة .. والسبب الثاني أننا نتوجه نحو توجه في المرحة الحالية في معالجة التسجيلات الإحترافية إبتداءً ثم ضمان آلية تسجيل وضمان جودة الصوت منذ بداية عملية التسجيل للقراء المختلفين في ربوع العالم الإسلامي حيث لا نشك في ما إذا كانت مرحلة إزالة الشوائب ستشوه البيانات الصوتية أم مجرد ستعمل على تنظيفها ..
بالنسبة للتلاوات القديمة كتلاوات الشيخ المعيقلي التي بها بعض الصدى وخلافه ... فهنا نعتمد على أنواع نماذج يمكنها تحديد أماكن عدم وجود كلمات وليس بالسكتات و هي النماذج التي تقوم بتفريغ النص أياً كانت لغته بغير الحاجة لفهم الكلمة نفسها .. وهناك مسار آخر وهو مقارنة التلاوة بالتلاوة وليس التلاوة بالنص ولكن هذا يحتاج لصناعة نموذج محسن لهذا الغرض .. وباذن الله نسعى في المسارات هذه سوياً ..
ندعوك أخي الحبيب للمشاركة في المشروع .. سنسعد كثيراً بمشاركتك والتعلم من خبرتك ..
وجزاكم الله خيراً ..