شهر الامارات للابتكار.. مجموعة أبحاث التعلم الآلي ومعالجة اللغة العربية تعرض أحدث أبحاثها العلمية
شاركت مجموعة أبحاث التعلم الآلي ومعالجة اللغة العربية - تزامناً مع شهر الامارات للابتكار لعام 2023 - بعرض أحدث بحوثها ضمن الاجتماع السنوي الثاني لمركز تحليل البيانات والأمن السيبراني بجامعة الشارقة.
وتتناول تلك البحوث موضوعات في النمذجة اللغوية العميقة وتحليل البيانات مع التعلم الآلي وأساليب التعلم العميق لمعالجة اللغة العربية، حيث تهدف المجموعة إلى تطوير الخبرات المحلية وتعزيز الوعي بأهمية معالجة اللغة العربية والتعلم الآلي في المجتمع ككل، كما يركز أعضاء المجموعة على مشاريع بحثية متعددة التخصصات بالتعاون مع جهات خارجية لديها اهتممات مشتركة حول الحوسبة العربية.
وتتكون المجموعة البحثية من أساتذة باحثين من كلية الحوسبة والمعلوماتية وكلية الهندسة “ الدكتور أشرف النجار منسق المجموعة البحثية، والدكتور إسماعيل شاهين، والدكتور علي أبو ناصيف، والدكتور عماد أفيوني، والدكتور إبراهيم أبكر هاشم، والدكتور إياد تركي، والدكتور أسامة أحمد العمري، والمهندس محمد البرهم”.
وركزت الأبحاث على دراسة وتحليل المدخلات النصية باللغة العربية بلهجات عربية مختلفة في المحادثات اليومية، وذلك لتطوير برامج دردشة قادرة على التحدث بلهجة المتحدث ومنها اللهجة المحلية الإماراتية، إلى جانب استخدام النمذجة اللغوية وأساليب التعلم العميق لمعالجة اللغة العربية، وتطبيق التعلم الآلي والتعلم العميق في مجال الرعاية الصحية.
ويهدف هذا البحث إلى التعرف التلقائي على الخط اليدوي، حيث يتم تحويل النصوص المكتوبة بخط اليد إلى شكلها الرقمي القابل للتحرير. بداية من تطوير نظام ذكي للتعرف على الأحرف ومن ثم تم تطوير نظام آخر للتعرف على الكلمات باستخدام نماذج التعلم العميق القائمة على شبكة عصبية تلافيفية (CNN)، والتي يتم تدريبها باستخدام مجموعات بيانات محددة تم معالجتها آلياً، وقد نجح النظام الــــــذكي محققــــاً دقـــة بلغت 98.27% في التعرف على الأحرف العربية المكتوبة بخط اليد وقام فريق البحث بتدريب النموذج باستخدام خمسة مجموعات بيانات متاحة وتحقيق دقة في استرجاع الكلمات بنسبة 88.93% وتجدر الإشارة إلى أن هذا المنتج قابل للاستخدام في الحقل التعليمي والعملي.
ويقوم البحث بالتصنيف التلقائي للهجات العربية على حسب القطر والدولة باستخدام تقنيات الذكاء الاصطناعي، والتي تعتمد على دمج عدة مجموعات من بيانات اللهجات المحلية المتنوعة في كافة الأقطار العربية.
حيث قام الفريق البحثي بتدريب سبعة نماذج للتعلم العميق، مما أنتج نظام ذكي قادر على التعرف على اللهجة بدقة 87.52 % للجمل القصيرة و 94.06% للجمل الطويلة، وتشير النتائج إلى فعالية المنهجية المقترحة وسيتم دراسة إمكانية البحث المستقبلي في هذه المنطقة.
وتم استخدام الذكاء الاصطناعي لأتمتة الكشف عن العديد من الأمراض ومنها مرض الزهايمر حيث تم تطوير شبكة عصبية تلافيفية (CNN) باستخدام التصوير بالرنين المغناطيسي (MRI) والتي من شأنها تصنيف الصورة لشخص سليم أو يعاني من إصابة خفيفة أو مصاب بمرض الزهايمر، ولقد تم تدريب النموذج على الفئات الثلاث باستخدام شرائح محورية للصور الموزونة والتي تغطي مناطق الدماغ كما تم تنفيذ بعض خطوات المعالجة المسبقة بما في ذلك التسجيل، وتجريد الجمجمة وتقليل الضوضاء على الصور وتقسيمها إلى مجموعة تدريب، وأخرى للاختبار والتحقق من صحتها وتم استخدام تأثيرات تقنيات ما قبل المعالجة المختلفة للمقارنة، حيث حقق النموذج دقة بلغت 98%.