اللسانيات الحاسوبية للتصريف الآلي للفعل الثلاثي الصحيح

اللسانيات الحاسوبية للتصريف الآلي للفعل الثلاثي الصحيح 398

عمر الكوسا  -  زياد الحج

العدد السابع – آذار مارس 2021

الصفحة 185-199

  • ملخص

    يهدف هذا العمل إلى إنشاء برنامج يعمل على التصريف الآليّ للفعل الثلاثيّ الصحيح، وهو جزء من سلسلة أبحاث متتالية تُعنى بالتصريف الآلي لأفعال اللغة العربية الثلاثية والرباعية والخماسية، الصحيحة والمعتلّة، المجرّدة والمزيدة. سيستفيد من البرنامج متعلمو اللغة العربية، ولاحقاً سيستثمر في مجال المعالجة الآلية للغة العربية وتحديداً في التعرّف الآلي إلى الأفعال داخل النصوص واستخراج المعلومات الصرفية عنها، ما سيشكل رافدًا للتطبيقات التي تُعنى بالتحليل الدلالي للنصوص. إنّ الدافع إلى هذا العمل ليس ندرة التطبيقات التي تُعنى بالتصريف الآلي، لكن افتقارها إلى الدّقة في النتائج، وسبب ذلك يعود الى اعتماد تلك التطبيقات على الكلمات المنسوخة حرفيًّا بالحروف اللاتينية عوضًا عن الحروف العربية إلى جانب قواعد بيانات مدمجة فيها، مثل برنامج (Reverso Conjugation) (https://tasrif.reverso.net، استخرج من الموقع في 9/2/2021)، أو على نماذج محدّدة مسبقاً وتُقاس على أساسها باقي الأفعال المراد تصريفها كبرنامج اللّامي (Mirad Abdelaziz and Bensaou Nacéra, 2015)، أو على قواعد تصريف معيّنة مع إهمال قواعد أخرى مثل برنامج قطرب (طه زروقي وفريق من المبرمجين، استخرج من الموقع في 12/12/2020 م)، وبرنامج (Acon Arabic Conjugator) (Baykal Erol, http://acon.baykal.be)؛ الأمر الذي يجعل النتائج غير دقيقة في حال أدخلنا أفعالاً جديدة لم يرد وصفها في تلك البيانات. أمّا مقاربتنا للإشكالية فتعتمد على أحرف الأفعال لتحديد أوزانها الصرفية ثم تصريفها، فقد ابتكرنا خوارزميات لسانية حاسوبية تنطلق من أحرف الأفعال وأوزانها وأقسامها لتصريفها في صيغ الماضي والمضارع والأمر، وذلك من دون اللجوء إلى قواعد البيانات للأفعال، وهذه الميزة ترقى بالبرنامج وتساعده على مواجهة التحديات والصعوبات التي تعترض العاملين في مجال الحوسبة اللغوية في مجال اللغة العربية بالتصريف الآلي. استخدمنا لغة البرمجة (C#.net) الموجودة ضمن برنامج (Visual Studio).
    ولمّا كان الفعل الثلاثي صاحب الرتبة مِن حيث تَصدّره في تآليف العلماء، والمنهج المُتَّبَع عندهم هو البدء بالصحيح قبل المعتلِّ، وبالمجرّد قبل المزيد، ولمّا كانت طبيعة البحث تقتضي تجزئة العمل ليناسب قواعد النشر في المجلّات المعتبَرة، رأينا تقسيم هذا العمل البحثي إلى مراحل، وأن تكون المرحلة الأولى مع الثلاثي الصحيح – المجرد.
    الكلمات المفاتيح التصريف الآلي، القعل الثلاثي الصحيح، اللسانيات الحاسوبية، الخوارزميات، البرنامج، تصريف الأفعال، قواعد التصريف، أقسام الأفعال.
  • Computational linguistics for the automatic conjugation of sound triliteral verbs

    This work aims to create a conjugation tool that first conjugates trilateral verbs in different tenses. It is part of a series of works dealing with automatic conjugation of Arabic verbs, whether they are trilateral, quadrilateral, quinqueliteral, regular and irregular, sounds and defective verbs.
    Arabic learners will benefit from this tool. The conjugation algorithm will be used later in Arabic Natural Language Processing, especially to recognize different Arabic verb forms and to recognize their morphological information.
    The motivation of this work is not the scarcity of tools dealing with automatic conjugation, but the lack of accuracy in their results. This is because some of them are relying on transliteration of words in Latin letters instead of relying on Arabic letters. Moreover, they make use of integrated databases which can affect performance, especially when dealing with large databases (like Reverso). Other tools make use of predefined forms of verbs so that new verbs could be measured to them (like Al-Lamy program), while others are based on specific conjugation rules that neglect other rules (like the Qutrub program and the Acon Arabic Conjugator) and that provide inaccurate results when introducing new verbs.
    In this paper, we propose an approach based only on letters of verbs to determine their morphological balance and then their conjugation. We have created a computational linguistics algorithm to conjugate verbs in the past, present and imperative tenses. The algorithm starts with reading letters of verbs, then determines their balance and part of speech, without using databases of verbs. This feature will improve the program and will help the Arabic computational linguistics community that faces challenges and difficulties in automatic conjugation. We developed our tool in C # .net which is part of the Visual Studio platform. Since trilateral verbs are the main focus of scholars, and since their methodology start with studying regular before irregular verbs, sounds before defective verbs, and since the research requires the division of the work to suit publishing rules in prestigious journals, we decided to divide this research into stages. The first stage will tackle the trilateral, regular, and sound verbs.
    Keywords: Automatic conjugation, ternary sound verb, computational linguistics, algorithms, program, verb conjugation, conjugation rules.

CITEPDF