السلام عليكم مجتمع إتقان،
أثار اهتمامي الموضوع المطروح سابقاً في المجتمع حول حدود الاستفادة من الذكاء الاصطناعيّ في تطبيقات القرآن الكريم وأردت في الحقيقة المرور على بعض المحدوديّات التي تعاني منها النماذج اللغوية عموماً، وما تؤثّر فيه هذه المحدوديات عند التعامل مع تطبيقات القرآن الكريم، وكيف يمكن التعامل مع هذه المحدوديّات من طرف المطوّر وتجنّب الوقوع في المشاكل الحاصلة بسببها.
عيوب النماذج اللغوية المتأصّلة فيها
هذه مجموعة من العيوب البنيويّة المتأصلة في طريقة عمل النماذج اللغوية، لا يمكن لزيادة القدرات المعالجية أو تطوّر التقنيّات تخطيها ولا إصلاحها، بل هي من لبّ طريقة عمل الأداة؛ فكما لا تصلح المطرقة لفكّ برغيّ، لا تصلح النماذج اللغويّة لحلّ نوعٍ من المشاكل لم تصنع لأجله.
وهذا مهمّ للغاية في سياق تطبيقات القرآن الكريم، فهي تتعامل مع كلام الله، الذي لا يحتمل الخطأ في النقل أو النشر، ولا حتى "بنسب قليلة". وبهذا يصبح استخدام النماذج اللغوية التي تعتمد على التوقع الإحصائيّ للتعامل خطراً وعيباً لا ينفع مع طبيعة القرآن الذي لا يجوز تحريف ولا تغيير ولا تبديل شيء منه مهما صغر أو كبر.
البيانات المستخدمة في التدريب
جودة الإجابات التي تقدمها النماذج اللغوية حول أيّ سؤال أو موضوع يطرح عليها مرتبطة بجودة البيانات التي تستخدم في تدريب هذه النماذج، وفي كثيرٍ من الأحيان، لا يمكن للمستخدم في الحقيقة معرفة هذه البيانات ما لم يدرّب هو بنفسه هذا النموذج.
هذا ما يجعل الكثير من النماذج التجارية المتوفّرة في الأسواق اليوم أداةً يصعب الاعتماد عليها في سياق التطبيقات القرآنية، خصوصاً في المجالات الأكثر حساسيةً مثل التفسير والترجمة، ما لم يعتمد المطوّر على مصادر جيدة لتقديم السياق للنموذج اللغوي، حتى يكون قادراً على معالجتها والبحث فيها والاعتماد عليها في الإجابات.
دون هذا السياق، أنت تعتمد على البيانات الأصليّة التي تدرّبت عليها هذه النماذج، وفي كثير من الأحيان تعمل الشركات الكبرى المدرّبة لهذه النماذج على "العبث" بما يمكن لهذه النماذج الوصول إليه والرد عليه ومعالجته.
النماذج اللغوية صندوق مغلق
يمكن تصنيف خوارزميات تعلم الآلة بشكل أساسي إلى خوارزميات التعلم الموجّه والتعلم غير الموجّه.
في التعلم الموجّه (Supervised Learning)، يتم تدريب النموذج على بيانات مُصنّفة مسبقًا، حيث يكون كل مدخل (input) مرتبطًا بمخرج صحيح (output) محدد. الهدف هنا هو أن يتعلم النموذج العلاقة بين المدخلات والمخرجات لكي يتمكن من التنبؤ بالمخرجات الصحيحة لبيانات جديدة وغير مرئية.
على النقيض، في التعلم غير الموجّه (Unsupervised Learning)، تعطى الخوارزمية بيانات غير مصنفة، وتكون مهمتها هي اكتشاف الأنماط والتركيبات المخفية في هذه البيانات بنفسها، مثل تجميع البيانات المتشابهة في مجموعات (Clustering).
تعتمد النماذج اللغوية الكبيرة (LLMs)، مثل التي تعتمد عليها تطبيقات الذكاء الاصطناعي التوليدي، بشكل أساسي على التعلم الموجّه، حيث تدرب على كميات هائلة من النصوص والبيانات المصنّفة لتتعلم كيفية توليد استجابات منطقية ومتماسكة.
لكن في كلّتا الحالتين، لا يمكن للمطوّر "الإطلاع" على طريقة عمل النموذج اللغويّ من الداخل، فالغرض منه أساساً أن يصل لطريقة عملٍ بنفسه دون تدخّل بشريّ مباشر.
على عكس البرمجيات التقليدية، لا يمكن للمطوّر "تجربة" أداء نموذج لغويّ ما ليضمن تأديته المهمّة ذاتها بالطريقة ذاتها في كلّ المرّات، فالنموذج اللغوي لا يمشي على "خوازرمية ثابتة" للوصول إلى ذات الإجابة في كلّ مرة، بل يسلك طرقاً مختلفة، قد تكون باختلافاتٍ بسيطة لا تأثير لها على النتيجة النهائية، وقد تكون ذات تأثيرٍ هائل على تلك النتيجة.
المشكلة هنا أنّ المبرمج لن يكون قادراً على معرفة الطريق هذا أو تعطيل الطرق غير الصالحة للوصول للإجابة أو التعديل على الخوارزميات الداخلية الناجمة من تعلّم الآلة، ﻷن طريقة وصول النموذج لهذا الجواب مبهمة ومعقّدة ولم تصنع ليكون للمطوّر قدرة النظر فيها والتغيير فيها كما في البرمجيات التقليدية.
يمكن التحايل على هذا باستخدام أوامر النظام - System Prompts وغيرها من الأساليب التي تحاول حصر الإجابات بطريقة معيّنة، لكن هذه نفسه لا يمكن ضمان تطبيقها في كلّ مرة بنفس الطريقة.
ما يعنيه هذا لتطبيقات القرآن الكريم، أنّ أيّ مهمّة متكررةٍ تعتمد على قدرة المطوّر على السيطرة على نتائج النموذج اللغوي بالكامل، لن تكون ممكنة إن كان الهدف الحصول على نتيجة صحيحة بنسبة 100%، وهذا يعني أنّ تطبيقات البحث الدقيق والاقتباس سواء من القرآن الكريم أو من التفاسير، لن تكون قابلة للتنفيذ باستخدام النماذج اللغوية.
ما يمكن إنجازه في هذا السياق هو تطبيقات البحث السياقيّ والبحث التحليليّ للكلمات، حيث يمكن للمبرمج التسامح مع قدرٍ من الخطأ - فالنموذج اللغوي ليس مسؤولاً هنا عن تقديم الإجابة مباشرة، بل تقديم كلمات مفتاحية يتم استخدامها للبحث في مصادر بيانات موثوقة وثابتة.
النماذج اللغوية تهلوس
هلوسة النماذج اللغوية هي إنتاجها لإجابات أو معلومات لا ارتباط لها بالواقع ولا بالبيانات التدريبية، وهي مشكلةٌ قادمةٌ من عدم قدرة النماذج اللغوية التمييز بين ما "تعلمه" وما "تجهله"... فهي في النهاية لا تقدّم بيانات ثابتةٍ من "ذاكرتها" بل تحاول الوصول لإقرب إجابة بطريقة "إحصائيّة" لما يسأله المستخدم.
أي أنّ النماذج اللغوية ليست آلات استعادة للبيانات المحفوظة في داخلها، بل آلات "تحزير" ذات قدرة عاليةٍ على الوصول للإجابة المرجوّة.
في هذا السياق، يجب على المبرمج الذي ينوي استخدام النماذج اللغوية في مشروعه القرآنيّ الحذر من إنتاجات هذه النماذج من الهلوسات، وأن يحاول منع هذا من خلال أوامر النظام وتوفير السياق وغيرها من الأساليب، لكن مع هذا، عليه أن يدرك أنّ هذا من صفات النماذج اللغوية المبنيّة، وأن ينبّه المستخدم عليها، حتّى لا يقع المستخدم في خطأ بسببها.
هذا ما يجوب في خاطري حول هذا الموضوع، وقد حاولت الاقتصار في حديثي على المشاكل المبنيّة لا المشاكل التي يمكن تخطّيها مع الوقت، كحجم السياق الممكن للنماذج اللغوية التعامل معه، والذي من المحتمل أنّ نحلّه مع الوقت مع تطوّر العتاد والنماذج اللغوية نفسها.
هناك بالفعل دراسات حول الموضوع في محاولة لحلّ مشكلة هلوسات النماذج اللغويّة أو مشاكل الدقّة فيها، كهذه الدراسة حول "أفتنا" لتوليد فتاوى دقيقة وتقليل الهلوسة عبر استخدام نموذج لغوي كبير مع تقنية RAG والاعتماد على طبقة فرز ذكية للتأكد من صحة النتائج.
هل لديكم إطلاع على دراسات أخرى في هذا السياق؟ وما هي الحلول التي تعتقدون أنّها من الممكن أن تخفف من هذا الأثر في النماذج اللغوية؟ وإلى أيّ قدر يمكن أن تصل فيها الدقة لتكون صالحة للاستخدام في مجال القرآن الكريم؟