Archive for the ‘التقنية العربية’ Category

إصدارات جديدة من مكتبات اللغة العربية بالبايثون

2018/04/29

تم بحمد الله إطلاق إصدارات جديدة من مكتبات اللغة العربية بلغة بيثون

وهي

  • مكتبة العربية PyArabic 0.6.4
  • مكتبة تاشفين لتجذيع النصوص Arabic light stemmer  0.3.2
  • مكتبة نفطويه لتصنيف الكلمات v0.3
  • مكتبة قلصادي للتحليل الصرفي  v0.3
  • مكتبة قطرب لتصريف الأفعال v1.2.1

التحديثات الجديدة هي :

  • موافقة المكتبات للإصدار الثالث من بيثون
  • بنية أفضل للمكتبات
  • تحسين التوثيق
  • تصحيح بعض الأخطاء

تجربة الأداء

يمكن تجربة وظائف كل مكتبة على موقع مشكال، من قسم الأدوات

مكتبة جديدة لقاموس التحليل الصرفي

وقد أطلقنا أيضا مكتبة جديدة لقاموس الراموز ( قاموس للمطورين في التحليل الصرفي)، باسم arramooz-pysqlite.

المكتبة الإصدار رابط المكتبة المصدر
مكتبة العربية

PyArabic

0.6.4 pypi github
تاشفين لتجذيع النصوص 

Tashaphyne Arabic light stemmer

0.3.2 pypi github
نفطويه لتصنيف الكلمات

Naftawayh word tag guess

v0.3 pypi github
قلصادي للتحليل الصرفي 

Qalsadi Morphology analyzer

v0.3 pypi github
قطرب لتصريف الأفعال

Lib Qutrub : verb conjugation

v1.2.1 pypi github
قاموس الراموز للتحليل الصرفي Arramooz-pysqlite : arabic dictionary for morphology V0.1 pypi github
Advertisements

تعريب برنامج الاستكمال التلقائي

2014/04/04

شرعنا بعون الله  في تعريب برنامج الاستكمال التلقائي (autocomplete)، برنامج الاستكمال التلقائي يهدف إلى مساعدة المستخدم في إكمال الكلمات أو الجمل من خلال الضغط على أول ثلاث أو أربعة حروف .. بالاعتماد على قائمة كلمات جاهزة قابلة للتحديث.

الميزة الأهم لا يشترط أن تكون الأحرف التي تكتبها في بداية الكلمة، بل يمكن أن تغفل بضعا منها

مثلا حين تكتب :
mngmt
أو
mgnt
فيقترح عليك كلمة
management
وذلك لأن جميع الحروف التي أدخلتها في الأولى موجودة في الثانية بالتتابع (لايشترط أن تكون متتالية مباشرة بل يمكن أن يكون بين كل حرف حروف أخرى).

وهذا يفيد في كتابة الاختصارات
ومثلا إذا كتبتها mana
فسيقترح عليك أيضاً:
managment
manager
managing
الخ

“أحتاج إليها في تعلّم كتابة كلمات  لغة أخرى”،

هذه إحدى فوائد هذا البرنامج، وكثير ممن يتعلمون اللغات الأخرى لديهم مشاكل في التهجئة فيتذكرون بعض الأحرف في الكلمات وينسون البعض الآخر .. فهذه ستفيدهم كثيراً ..
تطوير البرنامج:

صُمّم برنامج AutoHotKey لأداء مهام سريعة وأتمتة العمليات كالماكرو وما إلى ذلك ثم تطوّر ليصبح لغة برمجة بسيطة لأداء عمليات مختلفة. ميزة البرنامج الأهم أنه سهل بالنسبة لغير المتخصصين ويقوم بمهام رائعة جداً، ويمكّن تحويل السكريبتات المكتوبة به إلى برامج قائمة بذاتها.
برنامج الاستكمال التلقائي مصمم بهذه اللغة.

البرنامج الأصلي:

https://github.com/Uberi/Autocomplete/releases

وصلة مصدر البرنامج بعد التعريب

https://github.com/linuxscout/Autocomplete

أفكار مستقبلية:

–         هل يمكن استخدام هذا البرنامج لتصحيح الأخطاء الشائعة مثل الغلط في الهمزة، وبين الضاد والظاء.

–         هل يمكن استخدامه لاقتراح التشكيل عند الكتابة.

إطلاق إضافة مشكال لقارئ الشاشة NVDA

2014/04/04

أطلقنا – بحمد الله ومنّته- برمجية مُلحقة لبرنامج قارئ الشاشة مفتوح المصدر NVDA ، تسمح هذه الإضافة بتشكيل النصوص العربية بواسطة برنامج مشكال، وهذه الإضافة مفيدة جدا للمكفوفين الذين يستعينون بقارئ الشاشة لاستعمال الحاسوب.

البرمجية الإضافية للتشكيل تسمح حاليا للكفيف أن يشكّل أي نصِّ يحدده في أي مكان من الشاشة، ومِن ثمّ يمكنه الاستماع إليه مشكولا. ونطمح مستقبلا إلى ربط مشكال مباشرة بآلة النطق كي تشكّل كل النصوص قبل نطقها مباشرة.

وقد سبق لنا أن أطلقنا مشروع المنطيق لتحويل النص العربي إلى كلام، إذ أضفنا دعم العربية لبرنامج توليد الكلام إسبيك مفتوح المصدر، ويمكن تشغيله أيضا على قارئ الشاشة إن.في.دي.أ NVDA.

تحميل الإضافة: تحميل الإضافة موقع sourceforge

 

 

(more…)

موارد المصطلحات التقنية والعلمية

2012/03/12

يشتكي العاملون على الترجمة العلمية، والعاملون في الميادين العلمية من قلة مصادر المعلومات وصعوبة ترجمة المصطلحات، ويتخذها الكسالى حجة لضرب العربية بصفتها لغة غير علمية ليس بها مصطلحات علمية ومصطلحات دقيقة في أحيان أخرى، وربما ازداد الشك والسخرية إذا كانت المصطلحات غير موحّدة، ومختلفة فيتساءل المرء أيها يأخذ وأيها اقرب للصحيح.

يعجبني في اللغة العربية وفي كتب اللغة أنّ لفظ الاصطلاح يعني ما اصطلح أي اتفق عليه جمع من العلماء على تسميته بالاسم الجديد، وإن كان في معناه الأصلي غير ما في اصطلاحه، ونجد في كتبنا القديمة مثلا كلمة الجهاد لغة واصطلاحا، فمعناها الاصطلاحي يختلف عن معناها اللغوي لأنها وسعت معاني جديدة وترتب عليها تشريع وحقوق.

لذا فإن المصطلح في أصله اتفاق فلو اتفقنا أن الاختراع الجديد الذي وصلنا منذ مدة والمسمى The Invengamitoring  سنسميه بالعربية “الألوقة”، فإن اتفقنا على ذلك، فلا داعي للبحث عن معنى الألوقة لأنها صارت مصطلحا اصطلحنا عليه.

وسبب معنى كلمة الاصطلاح أي الشيوع والقبول والاتفاق هو ما يجعل المتعودين على اللفظ الأجنبي كما ألفوه لا يُسلّمون بسرعة للمصطلح الجديد، وما إن تتعوّد ألسنتهم على المصطلح حتى لا يبغون عنه حِولا.

أردت أن أقدّم بما سبق المجهود التي يُبذل في هيئاتنا العلمية من أجل وضع المصطلحات العلمية وتوحيدها، وإليكم بعضا منها التي توفر خدمة البحث على الشبكة:

1-   مكتب تنسيق التعريب بالرباط:

وهو هيئة عمرها خمسون عاما،  ومن لا يعرفها يظلمها، وساهمت في وضع الكثير من المعاجم الموحدّة في العلوم المختلفة كالطب، والهندسة والرياضيات، والكثير من العلوم آخذة بالاعتبار اللغات الأجنبية المتداولة في العالم العربي كالإنجليزية والفرنسية. وجهد المكتب كبير في توحيد الكثير من المصطلحات التي نتداولها اليوم،  ومعاجمها مطبوعة، بل ومنشورة على النت على موقعها.

 

http://www.arabization.org.ma/ (more…)

سدّدها أو مررها: فكرة محرر معادلات رياضية عربية

2012/02/03

هذه الفكرة همّ كبير وبرنامج جرّب حظّهم فيه الكثير من المهتمين، وكان موضوعا مهما في بلادي، حتى وقت قريب، إذ استغنى إصلاح المنظومة التربوية عن المعادلات العربية وغاب حرف السين عنّا مرة أخرى، بحجة استعمال الترميز العالمي للرياضيات، لكن يبدو أنّ الله قيّض للعربية من يرفعها إلى الترميز العالمي، وهو الدكتور عزالدين لزرق، بأعماله في توصيف الرياضيات العربية وإضافتها إلى الترميز العالمي الموحدّ يونيكود ابتداء من الإصدار 6.1، والمواصفة العالمية لتوصيف المعادلات الرياضية MathML.  دون أن ننسى بطبيعة الحال، نظام تخ TeX لتنضيد النصوص العلمية.

(more…)

إصدار يونيكود 6.1 يضيف 183 حرفا عربيا

2012/02/02

أطلق نهاية شهر يناير 2012 الإصدار 6.1 من مواصفة اليونيكود الترميز العالمي المُوحّد ليحمل في طياته مزايا عديدة،  فقد أضيف إلى هذا الإصدار 732 حرفا، منها 183 في العربية وحدها ما يمثّل 25% من الحروف المضافة. قد يكون أكثر ما يهمّنا إضافة 183 حرفا عربيا جديدا، هذه الإضافات العربية تشمل أساسا 143 حرف عربيا خاصا بكتابة الرياضيات باللغة العربية.

دوليا، أضيفت حروف جديدة، ودعم للغات الصينية في آسيا، وبعض اللغات في إفريقيا. كما أضيفت تحسينات على تقسيم الفقرات إلى سطور في من أجل العبرية واليابانية، ومزايا للتنقل بين الترميز الصيني التقليدي والمبسّط.

كما أضاف 40 حرفا آخر من بينها علامات قرآنية إضافية هي التنوين المتتابع، وحروف خاصة باللغات الإفريقية المكتوبة بالعربية، والتي قد لم تسمعوا من قبل، بل وحتى حروفا للاستعمال في الفلبين.

وقد أضيف إلى العربية فصلان    في الترميز سُمي الأول العربية الموسعة أ، وتمتد من 08A0..08FF، وقسم للرموز الرياضية العربية يمتد من 1EE00..1EEFF.

الكتابة الرياضية بالعربية تشمل الرموز المستخدمة في المدارس العربية ومعاهد التعليم عبر كامل العالم العربي، آخذة بعين الاعتبار الاختلافات بين مختلف الأقطار، من جهة أخرى، تأخذ المواصفات العربية الموّحدة والمنبثقة عن المنظمات والهيئات الموصية بذلك.

وللعلم فإنّ الفضل يرجع للأستاذ عزالدين لزرق من المغرب في العمل على الكتابة العلمية العربية وعلى رأسها الرياضيات، ويتميّز عمله بالمساهمة بإضافة الرموز العربية والترميز العربي العلمي إلى المواصفات القياسية مثل اليونيكود، وأيضا MathML  الذي أضاف الترميز العربي الرياضي منذ إصداره الثالث.

المراجع

1- المزايا الكاملة الإصدار الجديد 6.1 من اليونيكود http://www.unicode.org/versions/Unicode6.1.0/#Summary
2- مواصفة اليونيكود http://www.unicode.org/versions/Unicode6.1.0/#Summary
3- قسم المحارف العربية الرياضية http://www.unicode.org/charts/PDF/Unicode-6.1/U61-1EE00.pdf
4- قسم الحروف العربية الموسعة أ. http://www.unicode.org/charts/PDF/Unicode-6.1/U61-08A0.pdf
5- مواصفة MathML  لتوصيف المعادلات الرياضية، القسم العربية http://www.w3.org/TR/arabic-math/ .
6- الدكتور عز الدين لزرق، الباحث في تنضيد النصوص العربية العلمية http://www.ucam.ac.ma/fssm/rydarab/ .

ملاحظة نشرت هذه التدوينة في وادي التقنية

مشكال لتشكيل النصوص العربية: إطلاق واجهة سطح المكتب

2012/01/07

بحمد الله ومنّته، أطلقنا اليوم واجهة سطح المكتب  لبرنامج مشكال لتشكيل النصوص العربية آليا مفتوح المصدر،  وبهذا يتوفر حاليا تطبيقان للبرنامج على الوب . وعلى سطح المكتب لنظام وندوز. وسيتوفر لنظام لينكس.


(more…)

إصدار تجريبي للمدقق النحوي العربي للمكتب المفتوح

2011/06/20

يسعدنا أن نقدم لكم أول إصدار تجريبي للمدقق النحوي  العربي لبرنامج OpenOffice/LibreOffice، المعتمد على  برنامج LightProof.
•    يقترح  هذا البرنامج تصحيح علامات الترقيم، وبعض الأخطاء الشائعة.
–    جر المثنى وجمع المذكر السالم.
–    أخطاء شائعة مثل علاوة على ذلك،
o    عن كثب->من كثب#خطأ شائع:لأن الكثب هو القرب
o    ثبت بأنه-> ثبت أنه# خطأ شائع: لأن ثبت فعل لازم يتعدى بالهمزة والتضعيف
o    غسيل الأموال->تبييض الأموال#لأنها ترجمة مبتذلة لـ (Money laundering).

الإصدار التجريبي:

–    هذا الإصدار تجريبي وفي مرحلة التطوير، وليس موجها حاليا للاستعمال الواسع.
–    لتجربة هذا الإصدار، يرجى اختيار اللغة العربية [الجزائر]
–    للاطلاع على مصدر المشروع
–    لتحميل الامتداد الخاص بأوبن أوفيس

للعمل:

–    إضافة الإعدادات المحلية للبلدان العربية الأخرى.
–    إضافة المزيد من الأخطاء الشائعة والحالات المختلفة
–    ربط المدقق النحوي بالإملائي، والاستفادة من مزايا  hunspell في التحليل الصرفي
–    تصميم إصدار خاص بالمتصفحات.

المشاريع الأخرى:

العديد من مشاريعنا تتشابه وتتكامل:
  • أيسبل هو مدقق إملائي  يدقق النصوص ويقدم الاقتراحات للمستخدم
  • غلطاوي : مصحح تلقائي، أي أنه يدقق الكلمات التي لها اقتراح واحد فقط، وخطؤها شائع في كتابتها.
  • أيسبل وغلطاوي يعملان في مستوى الكلمة فقط0
  • المدقق النحوي يهتم بالجمل، وسلسة من الكلمات، ويصحح الأخطاء الشائعة في التعابير والتراكيب.

أمثلة

الإصدار 3.1 من قاموس التدقيق الإملائي أيسبل

2011/06/02

تم بحمد الله إطلاق الإصدار 3.1 من قاموس التدقيق الإملائي أيسبل،

والذي يتضمّن بعض التصحيحات:

  • إضافة حالات الفعل اللازم عند بتائه للمجهول سار سير.
  • تصحيح مسألة  توافق => تووفق (في المبني للمجهول) وما شابهه.
  • إضافة خاصية استبدال الحروف المتقاربة على لوحة المفاتيح.

الإصدار الجديد متوفر للتحميل على موقع أيسبل

قريبا: معجم الراموز الوسيط

2011/03/27

سيتم إطلاق مشروع جديد، نرجو المساعدة

معجم الراموز الوسيط ، معجم عربي حر مفتوح، يهدف إلى توفير البيانات المعجمية في شكل قابل للاستخدام والتطوير، للعاملين في مجال المعالجة الآلية للغة العربية.

مزايا

  • القاموس يضم المفردات مصنفة، ومرفقة بقائمة القواعد التصريفية الممكن تطبيقها عليها.
  • المعجم يحتوي على من 50.000 مفردة تتوزع على ما لا يقل عن 10.000 فعل عربي، و40.000 اسم وعشرات الحروف والأدوات النحوية وما استثني منها.
  • المفردات مشكولة شكلا تامّا ومرفقة بالمعلومات عن ما يلحقها من زيادات صرفية.

كما يضم المشروع عددا من المعاجم المرافقة مثل:

(more…)