«الضاد» والذكاء الاصطناعى الاندماج الصعب! ..مقررات جديدة بأقسام اللغة العربية لتوظيف التطبيقات التكنولوجية

ذكاء الاصطناعى
ذكاء الاصطناعى

التعامل مع الخطوات المتسارعة للذكاء الاصطناعى أصبح حاجة ماسة وضرورية لتطوير تقنيات تجيب عن أسئلة البشر، وتقوم بالتلخيص والترجمة، وتحويل النص إلى صوت والعكس، وتحويل الصور إلى نص والعكس، وغيرها من التطبيقات التى تسهل على الناس حياتهم؛ خاصة فى مجالات البحوث والدراسات باللغة العربية؛ ولأن التحديات التى تواجه «الضاد» للتزاوج والاقتران مع آليات الذكاء الاصطناعى أكبر وأعمق من باقى اللغات؛ فكان هذا التحقيق الذى يحاول الإجابة عن السؤال الأبرز: كيف نستفيد من التقنيات الحديثة لخدمة اللغة العربية بكل مجالاتها: 

يقول د. محسن عبد الرازق رشوان، الأستاذ المتفرغ بكلية الهندسة، جامعة القاهرة، وعضو مجمع اللغة العربية، إنه من المجالاتِ المذهلةِ التى قدمها الذكاءُ الاصطناعى فى ثورته تقنيات معالجةُ اللغات الطبيعية؛ التى تقوم على ثلاثة أركان أساسية تمثل جملة متماسكة فى تقديم التقنيات والتطبيقات، فالركن الأول هو البيانات وفرة ودقة، والركن الثانى هوالأساس الرياضى الذى تبنى عليه خوارزمية التعلم، خاصة ما يسمى التعلم العميق، والركن الثالث هو وفرة العتاد المناسب من الحواسيب والتى تعمل بالتوازي؛ لأن البيانات تمثل الزاد الذى يأخذ معظم الوقت والجهد تجميعا وإعدادا.

ويضيف أنه إذا كنا نقر بأن العالم قد قفز قفزات هائلة فى معالجة اللغات الطبيعية، فعلينا أيضا أن نعترف بأن اللغة العربية لم تأخذ ما تستحقه فى هذه التقنيات؛ بسبب تحديات كبرى يواجهها التعلم العميق عند تعامله معها، تحديات تتعلق بطبيعة اللغة نفسها التى تتعقد بنيتها الصرفية والتركيبية وما يتبع ذلك من تحديات علم الدلالة؛ ولو قارنا مثلا تطوير بعض التقنيات للغة العربية مع نظيرتها باللغة الإنجليزية فسنجد أننا نحتاج لكمية أكبر من البيانات لتصل دقة التقنية لنفس المستوى، فمثلا لتطوير تقنية للتعرف على الكلام وفى تخصص محدد مثل مجال الأعمال وجدنا أن اللغة الإنجليزية تحتاج لنحو 64 ألف كلمة للوصول إلى تغطية نحو 99% من الكلمات المستخدمة فى هذا المجال، بينما للغة العربية احتجنا لنحو 500 ألف كلمة للوصول لنفس مستوى التغطية. 



اقرأ أيضًا |  ميلاد نجوم جدد فى بلاط صاحبة الجلالة ..طلاب أكاديمية «أخبار اليوم » يبدعون فى مشروعات التخرج

ويتابع أن التحديات التى تواجه الذكاء الاصطناعى لا تقتصر على طبيعة اللغة العربية فقط، بل هناك عوامل أخرى مثل قلة الباحثين المدربين مع ندرة فى البيانات الجاهزة كما وكيفيا للتعامل مع الآلة وغيرها من العوامل؛ وتجهيز البيانات يمر بعدة مراحل تبدأ بالتخطيط وتحديد المقصود ثم جمع البيانات وتنظيفها وترميزها وانتهاء بالتقييم والاختبارات، وفى كل مرحلة هناك تفاصيل كثيرة، وأمام المتعاملين مع البيانات عدة تحديات منها: الاحتياج لكم كبير جدا من النماذج اللغوية الضخمة، ثم إعداد بيانات إضافية لعمل اختبارات متعددة لكشف مواطن القوة والضعف فى النماذج المولدة؛ وثمة مهمة أخرى ظهرت مع ظهور النماذج اللغوية الضخمة مثل الشات جى بى تى وغيرها، وهى ظاهرة الانحياز فيما تولده من إجابات ضد دين أو جنس أو لون من البشر.

تحليل البيانات
ويشير د. عمرو الجندي، الباحث فى مجمع اللغة العربية، والمتخصص فى استخدامات التقنيات الحديثة فى اللغة العربية، إلى أن تطبيقات الذكاء الاصطناعى لها الكثير من الاستخدامات فى مجال اللغة العربية، منها: تحليل البيانات، واستخراج المعلومات، وإعادة صياغة المعلومات، وإنشاء محتوى جديد، وتوفير الوقت والجهد، وتحسين مهارات الكتابة والتواصل، وتقديم خدمات أفضل لهم؛ كما تساعد العاملين فى مجال البحث العلمى للغة العربية وآدابها فى جمع كميات هائلة من الموارد اللغوية، سواء أكانت نصوصا أم أصواتا أم صورا، وتحليلها، وترجمتها، وتلخيصها، وتحديد خصائصها، واكتشاف ما بها من أنماط وعلاقات، ورصد ما بها من ظواهر، واكتشاف ما قد يعتريها من أخطاء، واستخراج البيانات منها، وإعادة صياغة تلك البيانات بما يتناسب مع أهداف العمل.



تحديات وتوصيات
ويضيف «الجندي» أنه أجرى دراسة حديثة فى هذا المجال توصل من خلالها إلى أن هناك تحديات تواجه تأصيل تطبيقات الذكاء الاصطناعى فى أقسام اللغة العربية وآدابها بالجامعات العربية؛ لعل أهمها: نقص الخبرات والكفاءات، ونقص المناهج والبرامج الدراسية، ونقص الموارد والتقنيات، وصعوبة تقبل الطلاب، وعوائق إدارية، وعدم الاقتناع أو الوعى بأهمية الموضوع؛ وأنه لا توجد أية مقررات دراسية ذات علاقة بتطبيقات الذكاء الاصطناعى خاصة لطلاب أقسام اللغةv العربية وآدابها فى أغلب الجامعات العربية.

ويتابع د. الجندى أن الدراسة قد أوصت بأن تتعاون لجنتا اللغة العربية والذكاء الاصطناعى واللغة العربية فى التعليم، وهما من لجان مجمع اللغة العربية بالقاهرة، بأن تتعاونا لتصميم مقررات دراسية خاصة لطلاب مرحلة الليسانس فى أقسام اللغة العربية وآدابها بالجامعات العربية؛ بحيث يتعلمون مهارات توظيف هذه التطبيقات فى دراسة الأصوات والصرف والنحو والمعجم، والقرآن الكريم والحديث الشريف والأدب، والبلاغة والنقد والعروض، وما قد يقدم لهم من دراسات فلسفية وتاريخية، بالإضافة إلى مهارات توظيف تلك التطبيقات فى المجالات المهنية ذات الصلة بالعربية وآدابها.

تقنيات المخطوط 
ويؤكد د. مراد الريفي، مدير معهد المخطوطات العربية، أن كتابة المخطوطات العربية قد امتدت إلى مدى زمانى وجغرافى شاسع، وقد أدى ذلك المدى المتسع من الإنسان والزمان والمكان وأنماط وأنواع الخطوط واختلاف الثقافات والأعراق والإثنيات إلى تنوع غير متناه فى أنماط وأساليب الكتابة المخطوطة ما جعل من العسير على تقنيات «التعرف الضوئى على الحروف» OCR  (Optical Character Recognition) أن تصل إلى مستوى مرض فى التعرف على الكتابة المخطوطة، وهو ما دعا إلى استحداث تقنيات «التعرف الذكى على كتابة خط اليد» HTR  (Handwritten Text Recognition) والتى تتيح تحويل النصوص المخطوطة إلى نصوص رقمية قابلة للبحث والاستخدام الإلكتروني، مما يسهل الوصول إلى المعلومات ويزيد من فعالية البحث والدراسة فى المخطوطات العربية.

ويضيف د. الريفى أن تقنيات التعرف الذكى على الكتابة المخطوطة تستند إلى استخدام الذكاء الاصطناعى وتقنيات التعلم العميق لتدريب نماذج رقمية قادرة على التعرف على الأحرف والكلمات من الصور المرقمنة من المخطوطات العربية، ويتم تدريب هذه النماذج على عينة واسعة من صور المخطوطات العربية، مما يسمح للنظام الرقمى بالتعرف على الأحرف والكلمات بدقة عالية.




 ويوضح أنه انطلاقا من تجارب المعهد التقنية السابقة والحالية ضمن إطار التحول الرقمي، مثل: قواعد بيانات النديم وفق معيار MARC21  والفهرسة الكوديكولوجية بمعيار  RDA-FRBR والبوابة الإلكترونية للمخطوطات العربية، ومشروع رقمنة الأصول الميكروفيلمية، وإتاحة التراسل للتصوير عبر البريد الإلكتروني، فقد اتجه المعهدُ للاهتمام بمجال جديد يواكب التطورات الرقمية المعاصرة، فكان التوجه صوب تقنيات وتطبيقات الذكاء الاصطناعى لبناء وتدريب نموذج للتعرف الذكى على الكتابة المخطوطة .