[size=32]المعالجة الآلية للغة العربية [/size]
[size=32]http://nlp4arabic.blogspot.com/2012/05/blog-post_23.html[/size]
[size=32] [/size]
مدونة تهتم بأبحاث اللغة العربية المختلفة وجمع مصادر لغوية تعين الباحثين وتطور هذا المجال
الأربعاء، 23 مايو، 2012
الكمبيوتر وصناعة المعجم العربي
[rtl]مقدمة:
نفترض بدءا أن عددا من إشكالات البحث المعجمي اللساني النظري لها" إسقاطا ت" في مجالات التطبيق ,وضمنها التطبيقات الحاسوبية .ولاشك أن بناء قاموسٌ مُحوٌٌُْسَْب يقتضي معرفة ملامح المستهلك ومجالات الاستخدام الممكنة أو المتوخاة من هذه الصناعة(كالترجمة الآلية, وفهم تركيب الكلام, واستخراج المعلومات ، ومعالجة النصوص،الخ...).إلا أن هناك متطلبات عامة للبناء لايمكن أن يقوم بعمل معجمي دون توفرها. وضمن هذه المتطلبات:
(ا)-تحديد المادة المعجمية وطبيعتها ومصدرها.
(ب)-تحديد محتوى المداخل المعجمية.
(ج)-تمثل وصوغ القواعد التي تربط بين المفردات،أوتحتسب ماهو حشوي فائض ضمن المعلومات التي ترد أو يمكن أن ترد في المداخل.
وواضح أن بناء المعجم يقتضي الفصل في مستوى نظري بين المعلومة المعجمية وغيرها من المعلومات التي تعالج ضمن
نموذج لغوي أعم (أومنظومة أعم). ويقصد هنا بالخصوص المعلومة التي تعالج في المحلل النحوي .فإذا كان المحلل
يتجه إلى القواعد النحوية العامة ,فان ما ننتظره هو عدم الخلط بين ماهونحوي من القواعد وما هو معجمي منها.
علما بأن المعلومة المعجمية لاتنحصرفقط في المفردات المخزنة ,بل تشمل أيضا الترابط العلاقي بين الوحدات والقواعد التي تحتسب العلائق الممكنة,أومايدعي بقواعد الحشو.
1-المادة موضوع الوصف والملكة المعجمية:
من الطبيعي,ونحن بصدد بناء قاموس آلي,أن نتساءل عن طبيعة المادة التي ستكون محتواه,وكذلك مصدر هذه المادة.أين هي المواد والمعلومات التي ستحوسب؟هل توجد في تاج العروس, أو في لسان العرب,أوفي المعجم الوسيط,أو غيرها من القواميس العربية؟
الجواب في عجالة : قطعا لا.
لقد ذهب جمهور اللغويين والنحاة العرب القدامى إلى أن المادة المعجمية يحددها السماع.واشترطوا من أجل حصر اللغة أن تسمع اللفظة .ويسمع معناها.
وفي هذا يقول الاستراباذي:" ...يحتاج إلى سماع استعمال اللفظ المعين, وكذا استعماله في المعنى المعين"(1).
فإذا كان الشرط الأول مقبولا في حدود ,لأنه يتيح وضع الحد بين ما هو مستعمل وماهو مهمل,فإن الشرط الثاني غير مقبول ,لأنه يحصر اللغة في ماهومكرر بلفظه ومعناه, ولا يخرج عما قاله وأبدعه السلف.
فلئن كانت معرفة المعجم تقتضي,فيما تقتضيه,معرفة "ذاكرة الجماعة",فإن من أهم مايشغل بال الباحث المعجمي تجدد هذه "الذاكرة" ,أووجود ذاكرة لاتلقن.
وإذا كانت الإسهامات المعجمية العربية في القرون الهجرية الأولى ذات أهمية تا ريخية كبرى بالنظر إلى تنوعها نهجا ومادة وتأليفا, فإن المعاجم العربية الحالية , رغم بعض الجهود المبذولة , تظل قاصرة , لاتلبي حاجات مستهلكيها.
ولئن مثل موقف واضعي المعجم الوسيط موقفا جديدا حين أنكروا انقطاع سلامة اللغة عند عصر معين , وفي مكان معين, وأهملوا الألفاظ المهجورة والغريبة,وأثبتوا المستحدثة أو المعربة مما أقره المجمع,فإن هذا المعجم يظل مع ذلك بعيدا عن المؤلف القاموسي المنشود.
فهناك فجوة كبيرة بين مايمثله هذا القاموس من معلومات,شكلا ومحتوى,وما نتوق إلى تمثيله ,من أجل رصد ملكة العربي معجميا. وسيتضح هذا في الفقرات الموالية ,حيث نتفحص البنية الداخلية للقاموس , وطبيعة وحدة (أو وحدات) المعلومات التي نحتاج إليها للتخزين فيه, ومحتوى المداخل المعجمية, وكذلك خصائص القواعد المعجمية.
2- القاموس والقواعد المعجمية:
يقول عبد القادرالفاسي الفهري: نتصور ,في مستوى نظري ,أنه يمكن بناء نوعين من القواميس:
قاموس واسع بما يكفي ليشمل لائحة طويلة جدا من المداخل , محشوة بكمية هائلة من المعلومات
منصوص عليها في المداخل , وقاموس مقعد,بمعنى أنه يشمل لائحة من القواعد,إضافة إلى لائحة المداخل, ويكون دور القواعد فيه أساس الإغناء عن تكرار المعلومات الحشوية في كل مدخل على حده,بل تقليص لائحة المداخل أيضا.
ــــــــــــ
(1) انظر شرح الشافية ,ج.1,ص.84.ع/كتاب المعجمة والتوسيط(نظرات جديدة في قضايا اللغة العربية)د.عبدالقادرالفاسي الفهري.ص63.
ويحتاج القاموس الواسع,طبعا, إلى ذاكرة ضخمة,لأنه قد يتضمن ملا يين المداخل والمعلومات,وهي ذاكرة لاتتوفر في الحواسيب الشخصية,مثلا. والأمر خلاف هذا في القاموس المقعد,إذ تعمل القواعد الحشوية في اتجاه تقليص حجمه, والاستغناء عن المعلومات المكررة, مما يجعل إدخاله في الحواسيب ذات الذاكرة المحدودة شيئا ممكنا.
وقد يكون من الضروري البدء أولا ببناء القاموس الواسع,ثم النظر في هذه المدونة الضخمة لفرز ما يمكن الاستغناء عنه. ومما يبرز القيام بهذا العمل بالنسبة للعربية مايلي:
2-1- إن جل الدراسات المعجمية العربية ليست نسقية بما يكفي حتى تعتمد في عملية التقليص وينتج عن ذلك بالفعل استغناء مهم عن المعلومات الحشوية ,يتيح بناء معجم مقعد.
2-2-ليس من الممكن استعمال "حدوس" متكلمي هذه اللغة اعتمادا مباشرا في تحديد الاطرادات, بل يجب تبني نتائج البحوث الأساسية الطويلة النفس( والقليلة للأ سف)سعيا وراء إعادة بناء أنساق اللغة العربية صوتيا وصرفيا وتركيبيا ودلاليا, وإصلاح ماأفسده , النحاة, قدامى ومحدثين.
3- المداخل المعجمية:
تنظيم الذاكرة المعجمية يجب أن يكون مرنا بما يكفي ليساهم في عمليات معقدة مثل التحليل والتوليد والفهم. ومما يجب أن يتضمنه المعجم من معلومات بالنسبة لكل وحدة معجمية مايلي :
3-1-الخصائص النطقية, بما في ذلك النبر ,إضافة إلى الخصائص الكتابية. ومعلوم أن المعاجم العربية لا تعالج الجانب النطقي إطلاقا.
3-2- الصور الصوتية للمفردة.
3-3- الخصائص الصرفية, بما في ذلك الصور الصرفية المختلفة للمادة الواحدة.
3-4- المعلومات التركيبية:الصنف المقولي, والإطار التفريعي ,والخصائص الإعرابية,...الخ.
3-5- المعنى: (ا)- الحد(المفهوم وعلائقه بالمفاهيم الأ خرى, كعلائق الترادف والتضاد...) (ب)- الشبكة المحورية. (ج)- قيود التوارد.
3-6- الخصائص البلاغية و المقامية.
ومن وجهة النظر اللسانية, يفضل المعجم الذي يتضمن أقل قدر من الرموز على المعجم التي يتضمن أكبر قدر منها,لأنه يسهل الاكتساب والفهم والإنتاج.
ويحدد شكل الوحدة التي نحتاج إليها لتخزين المعلومات في القاموس بحسب مايحتاج إليه المعالج في عملية التقطيع إلى وحدات أثناء البحث. أو ضم قطع لبناء معلومة مركبة عند الانتقاء.هذه الوحدات هي الجذر والصيغة والجذع الجرد أو الجذع المزيد أو الكلمة بكل تصريفاتها أو المركب المسكوك,بحسب مايمكن استخلاصه عن طريق القواعد ,أوما لا يمكن, وبحسب مايخضع لمبدأ التأليف,أو مالا يخضع.وقد يكون من اللازم هنا تطبيق بعض القواعد الكتابية أو الصوتية للوصول إلى صور الصرفيات التحتية أو السطحية عند الاقتضاء( " ازدهر"ـــــــــــــ"ازتهر").
ومحاولات تقليص حجم المعجم لا تشمل فقط التقليص داخل نفس المكون من مكونات المدخل, بل تتجه أيضا إلى التقليص عبر المكونات, نظرا إلى تداخل بعضها مع بعض. فهناك,مثلا,عدة معلومات تفريعيه يمكن الاستغناء عنها بوجود العناصر الدلالية وتحقيقها المقولي الاعتيادي. ثم إن عددا من الضوابط لبناء الكلمة يمكن استخلاصها من قواعد التركيب (كرتب اللواصق داخل الكلمة مثلا).
فهذه الإشكالات نظن أنها ذات أهمية بالنسبة لبناء القاموس, وكذلك استخدامه في التطبيقات الآلية.
إن كل المعجميين وغيرهم من العلماء يعرفون أن الزمان الذي كان يكتفي فيه بتحريرالجزازات وترتيبها (بشتى الترتيبات لجعلها على جزا زيات خاصة)قدمضى وانتهى.وأيقنوا بضرورة اللجوء إلى الوسائل التقنية الحديثة والاستعانة بها لأنهم عرفوا أن الحواسيب تقوم من العمل المتقن وفي وقت وجيزماتقوم به العشرات من الفرق في أشهر أو في سنوات,فالربح في الوقت وفي المال وفي الإتقان باستعمالنا للحواسيب لا يشك فيه أحد.إلا أن ظهور الحواسيب وتدخلها فيما لم يكن له حساب يوجب علينا أن نحدد بالضبط ماهي أنواع الأعمال التي يمكن أن يكفينا إياها الحاسوب وكيف يتم ذلك.فماذا عسانا أن نطلب منه مما يستطيع القيام به بسهولة وبسرعة مما كنا نعجز عنه تماما؟ فقبل أن نعدد فضائل الحاسوب نذكر القارئ الكريم أن أكبر فضل يكسبه الحاسوب هوأن له القدرة-العظيمة حقا- أن يدمج بفضل بعض البرمجيات,الآلاف من الكتب وأي نوع آخرمن النصوص وجعلها كأنها نص واحد ويستطيع بذلك أن يجري أي علاج وأي بحث عليها بأجمعها أوجزء منها,كمختلف أنواع الأسئلة عن وجود شيء وبأي صيغة وكالفهرسة والحصر والإحصاء وغير ذلك.
1- بصفة عامة يمكن أن يحول البحث في محتوى المدونة(العظيمة جدا)(1)والتصفح لها كله آليا وذلك:
-كحصر كل السياقات لكل كلمة وردت فيها أوفي جزء منها مع ذكر المرجع الكامل لها وهذا العمل هو عبارة عن فهرستها(فكل كلمة يذكر كل ما اقترنت به من القرائن في نص واحد أو كل النصوص.
وهذا بالنسبة للنص القرآني قد أنجز قبل اليوم(2)وقبل ظهور الحاسوب إلاأن الحاسوب يستطيع أن يفهرس أي كمية من العناصر من مدونة – ولو جاءت في ملايين من النصوص- في وقت قصير,وسنرى فوائد ذلك.
-حصر جميع العبارات الخاصة,لاالمفردات فقط,المتآلفة الألفاظ(3)بسياقات كل واحدة منها وذكر المرجع الكامل لها.ونعني بالعبارة هنا أي تركيب تقترن فيه كلمتان أوثلاث بشيء من التلازم.ففي العربية:<رفع الجلسة>هو المعروف ولا يقال أغلقها,ويقال:<شدأزره> لا<شد ظهره >.ويقال:<ضرب في الأرض> ولا يقال: في البرأوغير ذلك مما ينتمي إلى اللغة العربية وتدخل في هذا النوع كل الأمثال وما يجري مجراها أي كل تركيب خاص مثل الذي ذكرناه.
-تحليل آلي بالحاسوب لكل كلمة متمكنة تأتي في نص إلى مادتها الأصلية ووزنها.
-إحصاء آلي في نص أوعدة نصوص لكل وحدة لغوية أيا كانت بما في ذلك العبارات والجذور والأوزان.
ولكل واحدة من هذه العمليات فوائد كثيرة ومتنوعة,وسنرى ذلك في عرضنا الآتي لمنهجية العمل في صناعة المعاجم.هذا ويستطيع الحاسوب أن يجيب,على الفور,عن أي سؤال يخص وحدة لغوية معينة أوعدة وحدات في وقت واحد,لفظا ومعنى ومن أي جانب كان.
أما كيفية جمع المدونة وإنشائها فيكون السبيل إلى ذلك بمراعاة التنوع الكافي والشامل لمحتواها وهو المبدأ الأول الذي ذكرناه قبل,والمراد من ذلك هو تغطية كل ميدان من المعرفة وكل ميدان من الحياة العامة وغيرها,فيقام لذلك قائمة مستفيضة من هذه الميادين,وذلك مثل(وهو مجرد مثال)كل مايخص:
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
(1) د.عبد الرحمن الحاج صالح .بحوث ودراسات في اللسانيات العربية ,ج.2,الجزائر2008. يسمى الحاسوبي المدونة اللغوية,كما هو معروف,:قاعدة المعطيات اللغوية.
(2) المرجع نفسه. من ذلك كتاب:فتح الرحمن لآيات القرآن(لفيض الله بن موسى) والمعجم المفهرس لألفاظ القرآن الكريم (لمحمد فؤاد عبد الباقي).
(3) المرجع نفسه .وهي" مايجري في ا؟لأمثال"عند سيبويه.
العلوم الدقيقة والعلوم الطبيعية والعلوم التطبيقية والتكنو لوجيا,والعلوم الطبية والصيدلة والبيطرة والعلوم الإنسانية والفنون المختلفة وميدان الحياة العامة كالترفيه والإعلام والخدمات العمومية الكبيرة وغير ذلك.ولهذه القائمة تفاصيل تدخل فيها كل ما يخص الحياة العامة.
ولابد من توزيع النصوص إلى أدبية وعلمية ومن الحياة العامة على السواء ويجب أن يستخرج المنجزون للمعجم في البداية قائمة المداخل التي سيحتوي عليها المعجم من المدونة ويكمل ذلك,للتصحيح وللحاجة,بالرجوع إلى عدد من المعاجم الصغيرة والكبيرة القديمة والحديثة.
أما تهيئة وثائق العمل الخاص بتحرير المداخل فيكون في الغالب بالاستفادة مما ذكرناه من أعمال الحاسوب.
فيمكن أن يعتمد المحرر للمدخل بهذه الوسائل:
1- يقوم المحرر باستخراج المعاني من النصوص- وهوأهم كل الأعمال بكثير- يحصر كل السياقات وجمعها في مجموعة جزازات تخص الكلمة الواحدة (أي المدخل) وتكون فيها مرتبة بالترتيب الألفبائي(وغيره إن احتاج الىذلك)مستخرجة من المدونة عصرا بعد عصرإن كان الباحث يعتد بتاريخ الكلمة وإلا فلا ,فيكون الحصر خاصا بزماننا هذا فقط.
وهذه المجموعة من الجزازات تسمى عند معجمي القرن الواحد والعشرين <بملف اللفظة>.أما كيفية استنباط المعاني فقد وضع في ذلك الاختصاصيون قواعد دقيقة(1).
2- يستخرج المحرر أيضا من كل ملف العدد الكافي من السياقات التي لابد من ذكرها كشواهد,ويكون ذلك بحسب ما يقصده من المعجم: أن يكون موجها للاختصاصي أو الطلاب أو جمهور المثقفين.
3- يمكنه أن يدل في كل مدخل على درجة شيوعه ودرجة تردده على الألسن(من المدونات المنطوقة)أو على الأقلام بالاعتماد أساسا على المدونة فيما يخص المكتوب.وهي معلومات يحصل عليها بسهولة بالحاسوب وهذا جد مفيد بالنسبة إلى المصطلحات فقد لايعرف عن أحدها هل دخل بالفعل في الاستعمال أم لا وبأي اتساع.كما يمكن أن يبين إن كان يستعمل بكثرة في ميدان معين.فهنا يظهر فضل المسح الكامل للنصوص فهو مسح للاستعمال الحقيقي ولا يضاهيه النظر في المفردات في خارج إطارها الطبيعي.
ـــــــــــــــــــــــ
(1) د.عبد الرحمن الحاج صالح .بحوث ودراسات في اللسانيات العربية ,ج.2,الجزائر2008.وقد استعملنا بعض القواعد الخاصة عرضناها في بحث بعنوان:" تحديث أصول البحث العلمي في التراث اللغوي العربي"في مؤتمر مجمع القاهرةفي2005.
واللجوء إلى الحاسوب في هذا الميدان يدخل في ميدان العلاج الآلي للنصوص اللغوية وهو المشهور<بعلم العلاج الآلي للغة> وهو فرع من فروع اللسانيات الحاسوبية .ويحتاج هذا العلاج الآلي إلى مجموعة من البرمجيات الخاصة يضبطها المهندسون المختصون في هذا العلم وفي هذا الميدان ويستعينون في ذلك باللغويين فيما يخص الجوانب من اللغة التي يرغبون في البحث فيها.أما فيما يخص العربية فقد وضع بعض المهندسين العرب منذ زمن برمجيات خاصة لإلقاء أسئلة على المدونات المحسوبة التي جمعوها كالنص القرآني وكتب الحديث .أما المشروع العربي الكبير المسمى بالذخيرة العربية فقد تم وضع برمجية خاصة أيضا كبيرة القدرة إذ تمكن الباحث من إلقاء عدد كبير من الأسئلة المتنوعة على الذخيرة(وتسمى أيضا <بالانترنت العربي> ويشرع في إنجازه قريبا إن شاء الله على مستوى الدول العربية)(1).
هذا وتظهر الفائدة العظمى من المسح الكامل(بكل معنى الكلمة)للسياقات لمعرفة جميع المعاني للكلمة الواحدة(في عصر معين)لأن هذا العلم الذي نحصل عليه هو موضوعي مائة بالمائة: يستخرج بالاستقراء الكامل من المعطيات أي من الواقع. فصحة هذه المعرفة تكون مبنية إذن على صحة المعطيات من حيث هي مستخرجة من الاستعمال الحقيقي للغة من جهة وعلى شمولية العملية الاستقرائية من جهة أخرى مع العلم أن لا معنى للكلمة إلا في سياق كامل الدلالة. وهذا العمل الاستنباطي لانتصورأن يمكن تحقيقه بدون أن يستعان في ذلك بالحواسيب (2).لأنه عمل من جنس أعمال العمالقة لضخامته ومشقته وما يكلف من الوقت والمجهود.وأفيد من ذلك,في نظرنا,هو مايقتضيه علاج الحاسوب للنصوص – وأي نوع من المعلومات- من التشدد الذي لايرحم في الالتزام بدقة المنهج البحثي وبدقة الطرق التحليلية والتزام المنطق العلمي الحديث في كل سلوك يسلكه الباحث.
ــــــــــــــــــــــــ
(1)المرجع السابق.ص171.وقد أحسن مؤلفو المعاجم العربية تطبيق ما اتفق عليه المعجميون المحدثون من الأصول والقواعد الخاصة بالتعريف للمداخل وغيرها مما يخص المعجم فلن نتعرض لها.
(2) السابق .ص 171 ونعجب لمن يدعو إلى الاستعانة بالحاسوب ويتهاون في الوقت نفسه بمبدأ المسح الكامل لمدونة تجمع الملايين من النصوص حسب ما يتطلبه البحث اللغوي الحديث وقد تحقق ذلك بالفعل.
شهد العالم المعاصر ثورة حقيقية في مجال الإلكترونيات والبرمجيات والحاسوب وتقنية المعلومات.
وترجع بداية ظهورالكمبيوترإلى أواخرالاربعينات,وعندما أصبحت تقنية الحاسوب تتوسع لتصبح كيانا قائما بذاته بدأت مصطلحات أخرى تظهر على الساحة,مثل علم الكمبيوتر وعلم الحساب أو الاحتساب لتمييزه عن الحساب التقليدي في الرياضيات (1).
وقد دخل الحاسوب منذ ظهوره مجالات التعليم والثقافة,فتراه يستخدم في ميدان الترجمة,وفي مجال التعليم باعتباره وسيلة تقنية متطورة,تجئ بديلة عن الطرق التقليدية في التعليم والتلقين.
وتتسم اللغة العربية بأنها لغة تشكل الجذور فيها سمة أساسية,وينبني المعجم العربي - بصفة عامة- على الجذور التي يرد تحتها كل الكلمات التي تشتق من هذا الجذر أو تتفرع عنه. ومن هنا تختلف العربية عن الفرنسية والانجليزية,مثلا,ففيهما يكون اعتماد المعجم على الترتيب الالفبائى للكلمات (A,B,C),بينما يعتمد المعجم العربي على الترتيب الالفبائى للجذور,وفي إطار الجذر الواحد ترتب الكلمات؛ ولذا" تتميز شجرة المفردات العربية بقلة الجذور وتعدد الأوراق,شجرة ثقيلة القاع,فرغم صغر نواة المعجم5000- 7000جذر تقريبا,تتعدد المفردات بصورة هائلة,بفضل الإنتاجية الصرفية العالية.وسمة أخرى للمعجم العربي هي طغيان الخاصية الثلاثية للجذور العربية التي لاتحتاج إلى تأكيد,حيث تتوافرا لجذور الثلاثية بمعدلات تفوق بكثير تلك الخاصة بالجذور الرباعية والخماسية " (2).
ــــــــــــــــــــــــــــــــــــ
(1) د.عبد الإله الديوه جي: مفاهيم أساسية حول تقنية المعلومات,مجلة عالم الفكر,المجلد الثامن عشر.العدد الثالث.ص24. ع/دراسات في علم اللغة, تأليف: أ.د.فتح الله سليمان.ص 103.
(2) د.نبيل علي: اللغة العربية والحاسوب. مجلة عالم الفكر. المجلد الثامن عشر.العدد الثالث (1987).ص80. ع/دراسات في علم اللغة, تالفي: أ.د.فتح الله سليمان.ص 104.
والواقع أن عدد الجذور في العربية يفوق هذا الرقم بكثير, إذ يبلغ عددها في لسان العرب (9273)جذرا, ويزداد هذا الرقم في تاج العروس, حيث يبلغ (11978) جذرا.انظر:د. محمود الطناحي:تاج العروس والزمن البعيد. مقال بجريدة الأهرام بتاريخ 17/11/1998.
ومما يؤكد صدق مقولة قلة الجذور في العربية,قياسا إلى كثرة مفرداتها وألفاظها التي يمكن اشتقاقها من تلك الجذور,مايراه بعضهم من " أن في لغتنا العربية:اثنى عشر مليونا وثلاثمائة وخمسة آلاف وأربعمائةواثنتى عشرة لفظة "(1).
وثمة دراسات قليلة استطاعت أن تفيد من الحاسوب في الدراسات اللغوية,وأقل منها فيما يتصل بالدراسات المعجمية.وقد يعود ذلك إلى عدة أسباب:
1- حداثة دخول الكمبيوترالى الدول العربية بالنظر إلى بدء ظهوره,فبين ظهوره ودخوله إلى هذه البلاد مايقرب من عقدين من الزمان,ذلك أن البيئة العربية لم تعرف الكمبيوتر إلا منذ بداية الستينات.
2- أن استخدامه في البداية كان مقصورا على محالات محددة,منها البنوك ,والإدارات الحكومية,وشركات الطيران,وشركات البترول, ولم تكن من بينها الجامعات,مما أدى إلى تأخر- ولا أقول تخلف- تلك الجامعات ومراكز البحث العلمي عن الاستفادةبالامكانيات الكبيرة للحاسوب في المجا لات العلمية والبحثية المختلفة.
3- عدم اقتناع البعض بجدوى الكمبيوتر في الدراسات الإنسانية,ويرجع ذلك إلى فكرة مؤداها أن هذا الجهاز يتعامل مع الأرقام والإحصاءات والحسابات والجداول, ومن ثم فهــــــــو -في رأيهم- لايمكن أن يكون ذا فائدة كبيرة في هذه العلوم الانسانية.
4- وجود عقبات حالت دون الانتفاع بالكمبيوتر في مجال الدراسات العربية,تمثلت في تأخر ظهور شكل محدد لحروف اللغة العربية, مما أدى إلى تأخر " العديد من البحوث والدراسات والتطبيقات ذات العلاقة باللغة,ومن ضمنها التطبيقات الخاصة بالا لسنيات وتوثيق المعلومات واسترجاعها ؛إذ إن البحث عن المعلومات باللغة العربية من خلال الكلمات الدليلية أو التقارب الصوتي مايزال متخلفا,إذا ما قورن بما وصلت إليه مثل هذه التطبيقات في اللغات الحية الاخرى " (2).
5- قلة المواد والوسائل التعليمية المتاحة باللغة العربية والمتصلة بالمعاجم لشكل خاص,وكذلك البرامج والبطاقات الالكترونية المتخصصة, قياسا إلى غيرها مما يناظرها في فروع العلم المختلفة. على أنه ينبغي أن نسجل أن هذه المواد قد شهدت طفرة كبيرة في السنــــــــوات الأخيرة.
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
(1)د. حسن ظاظا:كلام العرب من قضايا اللغة العربية.دار القلم,دمشق,الدار الشامية,بيروت,ط2,(1410ه-1990م).ص98, 99. ع/دراسات في علم اللغة, تأليف: أ.د.فتح الله سليمان.ص 105.
(2)د.عبد الإله الديوه جي: مفاهيم أساسية حول تقنية المعلومات.ص 35. ع/ المرجع نفسه :ص106.
و من أبرز الانجازات والجهود ماتم في القرآن الكريم, حيث توجد برامج تقوم بما يقوم به (المعجم المفهرس لألفاظ القرآن الكريم)وزيادة؛حيث يمكن عن طريق البرنامج القرآني معرفة الآية أو الآيات التي ترد فيها الكلمة,ويمكن أيضا الوقوف على معنى تلك الكلمة وتفسير الآية التي تجئ فيها هذه الكلمة,إضافة إلى ترتيل لها مسموع, وغير ذلك من إمكانات قد لا تتصل بالمعجم.ومن تلك البرامج أيضامايغني عن(المعجم المفهرس لألفاظ الحديــــث النبــــــــوي الشريف)وزيادة؛ حيث يمكن للمرء أن يعرف نص الحديث الذي وردت فيه الكلمة ومعنى أية كلمة فيه,كما يمكن معرفة في أي كتاب من كتب الحديث الشريف ورد هذا الحديث, وفي أي باب من أبواب الكتاب الذي رواه, كما يحدد راويه أو رواته, ويورد نبذة عن هذا الراوي: حياته, وتلامذته,وشيوخه.
ومن الجهود العلمية الكمبيوترية الرائدة في مجال المعاجم تلك الدراسة التي قام صاحبها(1)باستخدام الكمبيوتر في الاحصاءاللغوي لجذور اللغة العربية في معجم الصحاح للجوهري, ويهدف بهاإلى: "عرض جذور مفردات اللغة العربية المستخدمة والواردة بالمعجم في صورة جداول توضح تردد الحروف في المواقع المختلفة من الكلمة ,وتتابع الحروف واختلا فها من حرف لآخر " (1). ويصل صاحب هذه الدراسة إلى عدة نتائج,منها أن الجذور الثنائية تمثل ,370 ./. من مجموع جذور معجم الصحاح ,وتمثل حروفها 24,0 ./:من مجموع حروف جميع الجذور...ويصل كذلك إلى أن عدد الجذور الثلاثية الممكنة – رياضيا- في اللغة العربية (38 3 ),أي: 21952كلمة,بينما يبلغ عدد الكلمات الثلاثية التي استخدمها العرب –كما في الصحاح -4814كلمة, وهذا العدد يمثل 93,21./:من هذا العدد المسموح به رياضيا.
ويتوصل الباحث كذلك إلى أن عدد الجذور الرباعية المسموح بها رياضيا هو(38 3 * 27) أي:592704كلمة,بينما ورد في الصحاح 766 جذرا رباعيا فقط,أي بنسبة 3,1 في الألف من العدد المسموح به ريا ضيا.وفيما يتعلق بالجذور الخماسية وجد أن عدد الجذور المسموح بها رياضيا تزيد عن17 مليونا من الجذور, بينما ورد في الصحاح 38 جذرا خماسيا فقط, تمثل:674,0 ./:من مجموع الجذور. كذلك خلصت الدراسة إلى أن الجذور غير الثلاثية بالمعجم تمثل ما يقرب من15./:من مجموع جذوره,وأن حروفها تمثل حوالي 19./:من مجموع حروف الجذور,أما الجذور السداسية وما فوقها فقد استبعدها لأن الجوهري لم يورد في معجمه أي جذر مكون من ستة أحرف أو أكثرمن ذلك .
ـــــــــــــــــ
(1)د.علي حلمي موسى:دراسة إحصائية لجذور معجم الصحاح باستخدام الكمبيوتر.الهيئة المصرية العامة للكتاب,1978.ع/دراسات في علم اللغة, تأليف: أ.د.فتح الله سليمان.ص 106.
(2) السابق ص 1
ومن النتائج المهمة التي انتهت إليها تلك الدراسة مايتعلق بتتابع الحروف ,فثمة حروف معينة لا تتلوها حروف بعينها ولا تسبقها حروف محددة ,فحرف (الشين),مثلا,لا يتبعه حرف (الضاد) ولا تسبقه الأحرف (ث,ذ,ز,س,ص,ض,ظ,ل)...
وثمة برامج كمبيوترية معجمية عديدة يتضح فيها تطويع الحاسوب لخدمة المعجم بشكل عام,بحيث يمكن للباحث أن يجد في هذا البرنامج ما يغنيه عن اللجوء, للمعجم المطبوع. ومن أهم هذه البرامج مايلي:
1- القاموس المحيط للفيروز أبادي:وينبني منهجه على إيراد الكلمات تبعا للترتيب الأصلي للقاموس,أي طبقا للحرف الأصلي الأخير من الكلمة,ثم الحرف الأول فالثاني...كما يعرض تلك الكلمات,متبعا الترتيب الألفبائي,مع إمكانية إضافة كلمات وملاحظات من خارج الأصل.
2- الرائد : وهو معجم لغوي عصري ,يتضمن بالإضافة إلى معجم الرائد لجبران مسعود,خمسة معاجم عربية هي:
(أ)- موسوعة النحو والصرف والإعراب.
(ب)- معجم المذكر والمؤنث.
(ج)- معجم المصطلحات اللغوية.
(د)- المعجم الأدبي.
(ه)- قاموس المصطلحات الأدبية واللغوية.
3- المورد:وهو قاموس مصور وناطق,ويحتوي على قاموس إنجليزي-عربي,لمنير البعلبكي,وآخر عربي- إنجليزي,لروحي البعلبكي.
-4معجم عبد النور.د/جبور عبد النور:وهو معجم عربي- فرنسي, فرنسي –عربي. ويمتاز بكونه ناطقا بصوت بشري واضح وباحتوائه على مجموعة من الصور التوضيحية.
5- معجم المصطلحات العلمية والتقنية: إنجليزي- عربي – فرنسي . ويضم ستة معاجم أكا ديمية متخصصة.هي كالآتي :
الإلكترونيات,الجيولوجيا,الطاقة,الفيزياء,الهندسة الكيميائية,هندسة المياه.
6- الأعلام للزر كلي :وهو قاموس لأشهر الرجال والنساء من العرب والمستعربين والمستشرقين وهو يقدم إلى جانب تراجم هؤلاء الأعلام رسوما بيانية للفترة الزمنية التي وجد فيها العلم مقارنة مع علم آخر.
وقد اقتحم العرب مجال الإحصاء اللغوي الحاسوبي منذ السبعينيات(1),وعقدت المؤتمرات والندوات العالمية والعربية,كان من أهمها المؤتمر الثاني حول اللغويات الحسابية العربية الذي عقد بالكويت عام 1989م, وسبقه الملتقى الرابع للسانيات العربية والإعلامية بتونس الذي ناقش بحوثا مثل:
(أ)- تدريس العربية لغير الناطقين بها بواسطة الكمبيوتر.
(ب)- نظام اشتقاق الكلمة العربية بالحاسب.
(ج)- المعالجة الآلية للكلمات والنص في الأعمال المصطلحية.
(د)- المعالجة الآلية لأوزان الشعر.
كما يعد على رأس المشتغلين بحوسبة الدراسات اللغوية العربية الدكتور( نبيل علي) الذي قدم عدة أعمال رائدة على رأسها كتابة:اللغة العربية والحاسوب,وبحثه:ميكنة المعجم العربي باستخدام المعالج الصرفي الآلي,وبحثه: الجيل الخامس ومعالجة اللغة العربية آليا,وبحثه:الفهم الأوتوماتكي للعربية غيرالمشكولة.
ومن أهم البحوث التي تناولت الموضوع- إلى جانب ما سبق- مايأتي:
(1)-العلاج الآلي للنصوص العربية للدكتور عبد الرحمن الحاج صالح.
(2)- ثلاثة إشكالات في حوسبة المعجم العربي للدكتور عبد القادرالفاسي الفهري.
(3)- التحليل الإحصائي لأصوات اللغة العربية للدكتور محمد علي الخولي.
(4)- الإطار الآلي للمعالجة الآلية للغة العربية للدكتور علي فرغلي.
(5)- المعاجم في الترجمة الآلية للدكتور محمود إسماعيل صيني.
(6)- المعجم الإلكتروني للغة العربية للدكتور محمد الحناش.
(7)- معالجة اللغة العربية بالحاسوب للدكتور محمد حشيش.
وهناك عدة جهات في العالم العربي تولي أهمية كبيرة لمثل هذا النوع من الدراسات منها:
أ- الجمعية المصرية للحاسب الآلي التي تقوم بتنفيذ مشروع بحثي متكامل عن اللغويات الحاسبية العربية يشتمل على أربعة مكونات هي:الذخيرة العربية,والتعامل مع مايقرب من أربعة ألاف وخمسمائة جذر من الجذور الشائعة وقواعدها, وتحليل الأصوات, والتعرف على الكلمات المكتوبة بخط اليد.
ب- المعهد العالي للعلوم التطبيقية والتكنو لوجيا بدمشق الذي أعد أو أشرف على عدد من البحوث منها:
*تعليم النحو والصرف بمساعدة الحاسوب.
*النظام الصرفي النحوي للعربية بالحاسب.
ــــــــــــــــــــــــ
(1)تم أول استخدام في العالم لمادة معالجة آليا في العلوم الإنسانية في أوائل الخمسينيات حيث أعدت قائمة بمصطلحات توماس الإكويني (المرجع 18/125). ع/صناعة المعجم الحديث,تأليف:د.أحمد مختار عمر,ص168
*المعجم الحاسوبي في نظام خبير للغة العربية.
*نظام اشتقاق الكلمة العربية بالحاسب.
*إحصاء الأفعال العربية في المعجم الحاسوبي.(1)
ج- الشركة العالمية لبرامج الحاسب الآلي التي تتخذ مقرا لها بالقاهرة وتقوم بإ نجاز عدد من المشروعات الحاسوبية العربية الهامة مثل:
*المكنز الآلي أو قاعدة بيانات المادة المعجمية العربية.
* المحلل الصرفي الآلي.
* المحلل الإملا ئى الآلي.
* قراءة النص العربي غير المشكول آليا.
د- العالمية للبرامج (صخر) ذات الجهود المتميزة,والمؤهلة الآن لإنشاء قاعدة بيانات لغوية ضخمة يستفاد بها في صناعة المعجم.
ـــــــــــــــــــــــ
(1)ويعد الحلقة الأولى من سلسلة حلقات عن المعجم الحاسوبي تتناول إحصائيات اللغة العربية(الأفعال-المصادر-الأسماء-الجموع-الجذور-الخ).وقد نشرته مكتبة لبنان عام 1996.ع/صناعة المعجم الحديث,تأليف:د.أحمد مختار عمر,ص169.
المراجع
1- صناعة المعجم الحديث:
د/أحمد مختار عمر-عالم الكتب-ط1(1418ه-1998م).
2- دراسات في علم اللغة :
د/ فتح الله سليمان- دار الآفاق العربية-القاهرة-ط1(1429ه-2008م).
3- بحوث ودراسات في اللسانيات العربية:
أ.د/عبد الرحمن الحاج صالح-المؤسسة الوطنية للفنون المطبعية وحدة الرغاية –الجزائر-الجزء الثاني-2007م.
4- المعجمة والتوسيط (نظرات جديدة في قضايا اللغة العربية):
د/ عبد القادر فاسي فهري-المركز الثقافي العربي الدار البيضاء-ط1-1997.
المقال بعنوان
الكمبيو تر وصناعة المعجم العربي
الأستاذ
- عمار المسيلي
-الهاتف :0779051122
- medlamine20102010@hotmail.com[/rtl]