تعاني النماذج اللغوية الحديثة، رغم تقدمها، من ظاهرة «الهلوسة» عند التعامل مع النصوص الدينية؛ إذ قد تولد آيات أو أحاديث لا أصل لها أو في غير محلها، ما يجعل الخطأ في هذا السياق بالغ الحساسية لما يسببه من التباسٍ وتشويه للمصادر الشرعية.
ومن هذا المنطلق شارك فريق BurhanAI بدراسة في المهمة البحثية IslamicEval 2025 ضمن مؤتمر ArabicNLP. مُقدمًا نظام متكامل للكشف عن النصوص الدينية في مخرجات النماذج، والتحقق من صحتها، وتصحيحها إن لزم، ثم استرجاع النص الصحيح من المصادر الموثوقة.
الفريق البحثي:
المرحلة الأولى
درب الفريق نموذج صغير ومحسّن (gpt-4.1-mini) لاكتشاف مواضع الآيات والأحاديث داخل النصوص. وحقق هذا النموذج أداءً بلغ %F1 = 87.10.
واستخدم الفريق أيضًا نموذج آخر بقدرات استدلال عالية (o4-mini) مزود بأداة برمجية داخلية تحسب مواضع الحروف بدقة عالية؛ حتى يتمكن النموذج من تحديد بدايات ونهايات الآيات والأحاديث بدقة. وحقق هذا النظام أداءً متميزًا بلغ F1 = 90.06٪، ما جعله يتفوق على نماذج أكبر حجمًا وأكثر كلفة.
المرحلة الثانية
طور الفريق آلية ذكية للبحث داخل النصوص تعتمد على التدرج من الدقة إلى الفهم؛ فالنظام يبدأ أولًا بمقارنة الكلمات حرفًا بحرف، ثم ينتقل تدريجيًا إلى فهم المعنى العام للجملة إذا لم يجد تطابقًا مباشرًا. بهذا الأسلوب أصبح قادرًا على التحقق من صحة النصوص بدقة بلغت 88.6٪، وتصحيح المقاطع الخاطئة بنسبة 66.56٪.
المرحلة الثالثة
اعتمد الفريق تقنية RAG، وهو أسلوب يجعل النظام يبحث أولًا في النصوص الأصلية قبل أن يجيب، فيسترجع المقاطع القرآنية أو الحديثية التي ترتبط بالسؤال مباشرة، ثم يصوغ منها الإجابة دون أن يضيف شيئًا من عنده. بالتالي أصبح النموذج أكثر فهمًا للسياق ودقة في الإجابة، وحقق نتائج مشجعة رغم محدودية الموارد.
النتائج والتوصيات
أظهرت التجارب أن النماذج الصغيرة المتخصصة - بعد ضبطها الدقيق - يمكنها أن تنافس أو حتى تتفوق على النماذج العملاقة مثل GPT-5 في المهام الدقيقة كاكتشاف وتصحيح الاقتباسات الشرعية. كما أثبت النظام أن الجمع بين الذكاء اللغوي والمنطق البرمجي (Tool-Assisted Reasoning) يمنح دقة وموثوقية أعلى في التعامل مع النصوص المقدسة.
ويوصى فريق BurhanAI بالتالي:
- توسيع قاعدة البيانات لتشمل النصوص بالتشكيل وبدونه
- إدخال نماذج عربية متخصصة لتحسين الفهم الدلالي للنص القرآني
- دمج التفاسير كمصادر مساعدة لإعادة صياغة الأسئلة دون التأثير على النتيجة
- تحسين فاعلية RAG لتغطية الأسئلة المركبة متعددة المعاني
تقدم تلك التجارب طريقًا ممهدًا نحو بناء تطبيقات إسلامية على أسس علمية دقيقة، تحترم النص القرآني وتضمن موثوقية المحتوى في كل ما يُنتج بالذكاء الاصطناعي.