نحو دراسات تليق بالعربية فى عصر الذكاء الاصطناعى
اللغة العربية، لغة جميلة ليس فقط بحكم العاطفة نحوها، ولكن أيضا بحكم الجمال الرياضى الذى يحكم التفاعل الثرى والتداخل القوى بين مستوياتها المختلفة من صرف ونحو وطاقة تعبيرية ودلالية هائلة. قد يكون هذا التداخل هو أحد أسباب أن بعض دقائق اللغة العربية لا تزال عصية وتمثل تحديا حقيقيا أمام برمجيات أو خوارزميات التعامل الآلى معها. فحسب آخر الدراسات وقياسات الأداء، حققت هذه الخوارزميات نتائج ممتازة فى التحليل الصرفى فى بداية مراحل التحليل لأن أقل خطأ فى هذا المستوى الأدنى من اللغة سوف يتسبب تلقائيا فى أخطاء أخرى أكبر فى المستويات الأعلى من التحليل التى تترتب عليه. وأداء هذه الخوارزميات جيد جدا أيضا فيما يخص التحديد الآلى لأقسام الكلام فى النصوص العربية والتوصل إلى أن كلمة مثل (كتب) اسم فى سياق لكنها فعل فى سياق آخر وهكذا.
وغياب التشكيل فى النصوص العربية الحديثة هو أحد الأسباب الرئيسية فى كثير من الأخطاء التى تقع فيها الخوارزميات فى هذا المستوى من التحليل الآلي. وأداء هذه الخوارزميات جيد فيما يخص الإعراب الآلى وتحليل البناء الداخلى للجمل والعبارات من تمييز للفاعل والمفعول والمبتدأ والخبر والنعت والمنعوت وصلة الموصول وغيرها. وهنا أيضا ترجع الكثير من أخطاء الإعراب الآلى إلى غياب التشكيل وتحديدا العلامات الإعرابية على نهاية الكلمات. فهذه العلامات هى التى تسمح بالمرونة فى ترتيب الفاعل والمفعول مثلا، فكل منهما عليه علامته الإعرابية التى تميزه أينما كان نتيجة تقديم أو تأخير.. أما أداء برمجيات التحليل الآلى لمعانى ودلالات الكلمات والعبارات والجمل فى النصوص العربية فلا يزال دون المستوى المطلوب من الدقة التى يمكن الاطمئنان إليها، وقد يرجع ذلك فى جزء كبير منه إلى أن العمل على التحليل الآلى لهذا المستوى اللغوى بدأ متأخرا نسبيا مقارنة بالعمل على المستويات الأخرى من اللغة العربية.
السؤال هنا: من يطور هذه البرمجيات أو الخوارزميات ويقوم بالدراسات العلمية المنهجية للغة العربية التى يتم على أساسها بناء هذه الخوارزميات؟ الإجابة: شركات ومؤسسات حكومية وفرق بحثية فى جامعات ومؤسسات ومراكز بحثية، معظمها خارج العالم العربي.
بالطبع، هناك فى العالم العربى من يفعل ذلك: أكاديميون ومؤسسات وشركات. جهد مشكور، لكن لا حجم الاهتمام الأكاديمى والبحثى ولا الاستثمار يليق باللغة العربية. سوف نركز هنا على الاهتمام الأكاديمى والبحثى لأن هذا من وجهة نظرنا هو حجر الأساس فى عملية إنتاج دراسات للغة العربية تغذى برمجيات وخوارزميات تحليلها آليا. والسؤال: من يقوم بدراسات للجوانب المختلفة للغة العربية بشكل منتظم فى عالمنا العربي؟ ثلاث فئات من الباحثين.
الفئة الأولي: تضم باحثين ينتمون بحكم التقسيم الأكاديمى إلى أقسام اللغة العربية فى كليات اللغات والألسن والآداب.
الفئة الثانية: تضم باحثين فى علم اللغة من خارج أقسام اللغة العربية وغالبا فى أقسام اللغات الأجنبية فى هذه الكليات.
الفئة الثالثة: تضم باحثين فى أقسام فى كليات الهندسة والحاسب الآلى وغيرهما من التخصصات ذات الصلة بالذكاء الاصطناعى والتحليل الإحصائى والرياضى للغة خارج مجال العلوم الإنسانية.
الفئة الأولى: هى أكثر الفئات الثلاث دراية بتاريخ اللغة العربية ودقائقها، وهذه الدقائق كما ذكرنا من أكثر التحديات التى تواجه التعامل الآلى للغة العربية. وهى أيضا الأكثر دراية بمدارس النحو العربى القديمة وإسهاماتها التى تستحق قراءة مختلفة وجديدة لها تجعلها ذات صلة. وهى أيضا وبصراحة الأقرب إلى روح اللغة العربية وثقافتها. والفئة الثانية، فئة الباحثين فى اللغة العربية من خارج أقسامها، قد تكون أكثر الفئات تطبيقا للنظريات اللغوية الحديثة على الظواهر المختلفة فى اللغة العربية ومقارنتها باللغات الأخري. أما الفئة الثالثة، فئة المهندسين، فهم بطبيعة التخصص الأكثر دراية بقدرات التعلم الآلى وحدود الذكاء الاصطناعى فى التعامل مع اللغات البشرية عموما واللغة العربية على وجه التحديد.
من المألوف أن تجد هذه الفئات الثلاث فى فرق بحثية فى مشروعات المعالجة الآلية للغة العربية خارج العالم العربي. لكن لماذا لا يجتمع هؤلاء فى فرق بحثية تليق باللغة العربية فى جامعات العالم العربي؟ والإجابة دون الدخول فى تفاصيل كثيرة: لأسباب بيروقراطية تجعل التخصصات جدرانا عازلة بين الباحثين وتجعل البحث فى قضايا اللغة العربية مناطق حرام على الباحثين فى غير أقسامها. والنتيجة جزر بحثية منعزلة، فلا أحد يستفيد بما يميز الآخر. كثير من جامعات العالم الآن تزيل كثيرا من هذه الجدران وتقوم بدمج الكثير من التخصصات والكليات فى كيانات بحثية وأكاديمية فائقة الضخامة والتكامل فى الوقت نفسه، لأن قضايا العالم الآن فى كل مجالات العلم والمعرفة تقريبا أصبحت أكبر من قدرات التخصصات القديمة بمفردها وكذلك أعقد من أدواتها فى الرصد والتحليل.
صحيح.. هناك مجهودات ومشروعات متفرقة وقليلة فى العالم العربى اجتمعت فيها الثلاث فئات، على رأسها وأهمها مشروع د.نبيل على – رحمة الله عليه – لكن أنا هنا أتحدث عن البنية التحتية من الناحية الإدارية والتعامل المنهجى مع القضية أكاديميا وهندسيا، الثلاثة أبناء اللغة العربية ولهم الحق فى دراستها وتحليلها. ومن حق اللغة العربية علينا أن يتعاون الجميع وأن يتم تغيير ما يحتاج التغيير فى اللوائح وغيرها من المعوقات لتسهيل الدراسات البينية والتعاون بين الفئات الثلاث لصالح اللغة العربية وحقها فى دراسات علمية تليق بها وتليق أيضا بعصر يشهد تطورات غير مسبوقة فى مجال الذكاء الاصطناعى عموما والمعالجة الآلية للغات البشرية على وجه الخصوص. ليس هناك سيناريو آخر لمصلحة اللغة العربية، غير أن يتعاون الثلاثة فى مشروعات قومية للمعالجة الآلية للغة العربية تليق بجلالها ومكانتها فى نفوسنا، وكل عام ولغتنا العربية بخير.