Archive for the ‘تقنية’ Category

إصدارات جديدة من مكتبات اللغة العربية بالبايثون

2018/04/29

تم بحمد الله إطلاق إصدارات جديدة من مكتبات اللغة العربية بلغة بيثون

وهي

  • مكتبة العربية PyArabic 0.6.4
  • مكتبة تاشفين لتجذيع النصوص Arabic light stemmer  0.3.2
  • مكتبة نفطويه لتصنيف الكلمات v0.3
  • مكتبة قلصادي للتحليل الصرفي  v0.3
  • مكتبة قطرب لتصريف الأفعال v1.2.1

التحديثات الجديدة هي :

  • موافقة المكتبات للإصدار الثالث من بيثون
  • بنية أفضل للمكتبات
  • تحسين التوثيق
  • تصحيح بعض الأخطاء

تجربة الأداء

يمكن تجربة وظائف كل مكتبة على موقع مشكال، من قسم الأدوات

مكتبة جديدة لقاموس التحليل الصرفي

وقد أطلقنا أيضا مكتبة جديدة لقاموس الراموز ( قاموس للمطورين في التحليل الصرفي)، باسم arramooz-pysqlite.

المكتبة الإصدار رابط المكتبة المصدر
مكتبة العربية

PyArabic

0.6.4 pypi github
تاشفين لتجذيع النصوص 

Tashaphyne Arabic light stemmer

0.3.2 pypi github
نفطويه لتصنيف الكلمات

Naftawayh word tag guess

v0.3 pypi github
قلصادي للتحليل الصرفي 

Qalsadi Morphology analyzer

v0.3 pypi github
قطرب لتصريف الأفعال

Lib Qutrub : verb conjugation

v1.2.1 pypi github
قاموس الراموز للتحليل الصرفي Arramooz-pysqlite : arabic dictionary for morphology V0.1 pypi github
Advertisements

إصدار يونيكود 6.1 يضيف 183 حرفا عربيا

2012/02/02

أطلق نهاية شهر يناير 2012 الإصدار 6.1 من مواصفة اليونيكود الترميز العالمي المُوحّد ليحمل في طياته مزايا عديدة،  فقد أضيف إلى هذا الإصدار 732 حرفا، منها 183 في العربية وحدها ما يمثّل 25% من الحروف المضافة. قد يكون أكثر ما يهمّنا إضافة 183 حرفا عربيا جديدا، هذه الإضافات العربية تشمل أساسا 143 حرف عربيا خاصا بكتابة الرياضيات باللغة العربية.

دوليا، أضيفت حروف جديدة، ودعم للغات الصينية في آسيا، وبعض اللغات في إفريقيا. كما أضيفت تحسينات على تقسيم الفقرات إلى سطور في من أجل العبرية واليابانية، ومزايا للتنقل بين الترميز الصيني التقليدي والمبسّط.

كما أضاف 40 حرفا آخر من بينها علامات قرآنية إضافية هي التنوين المتتابع، وحروف خاصة باللغات الإفريقية المكتوبة بالعربية، والتي قد لم تسمعوا من قبل، بل وحتى حروفا للاستعمال في الفلبين.

وقد أضيف إلى العربية فصلان    في الترميز سُمي الأول العربية الموسعة أ، وتمتد من 08A0..08FF، وقسم للرموز الرياضية العربية يمتد من 1EE00..1EEFF.

الكتابة الرياضية بالعربية تشمل الرموز المستخدمة في المدارس العربية ومعاهد التعليم عبر كامل العالم العربي، آخذة بعين الاعتبار الاختلافات بين مختلف الأقطار، من جهة أخرى، تأخذ المواصفات العربية الموّحدة والمنبثقة عن المنظمات والهيئات الموصية بذلك.

وللعلم فإنّ الفضل يرجع للأستاذ عزالدين لزرق من المغرب في العمل على الكتابة العلمية العربية وعلى رأسها الرياضيات، ويتميّز عمله بالمساهمة بإضافة الرموز العربية والترميز العربي العلمي إلى المواصفات القياسية مثل اليونيكود، وأيضا MathML  الذي أضاف الترميز العربي الرياضي منذ إصداره الثالث.

المراجع

1- المزايا الكاملة الإصدار الجديد 6.1 من اليونيكود http://www.unicode.org/versions/Unicode6.1.0/#Summary
2- مواصفة اليونيكود http://www.unicode.org/versions/Unicode6.1.0/#Summary
3- قسم المحارف العربية الرياضية http://www.unicode.org/charts/PDF/Unicode-6.1/U61-1EE00.pdf
4- قسم الحروف العربية الموسعة أ. http://www.unicode.org/charts/PDF/Unicode-6.1/U61-08A0.pdf
5- مواصفة MathML  لتوصيف المعادلات الرياضية، القسم العربية http://www.w3.org/TR/arabic-math/ .
6- الدكتور عز الدين لزرق، الباحث في تنضيد النصوص العربية العلمية http://www.ucam.ac.ma/fssm/rydarab/ .

ملاحظة نشرت هذه التدوينة في وادي التقنية

قريبا: معجم الراموز الوسيط

2011/03/27

سيتم إطلاق مشروع جديد، نرجو المساعدة

معجم الراموز الوسيط ، معجم عربي حر مفتوح، يهدف إلى توفير البيانات المعجمية في شكل قابل للاستخدام والتطوير، للعاملين في مجال المعالجة الآلية للغة العربية.

مزايا

  • القاموس يضم المفردات مصنفة، ومرفقة بقائمة القواعد التصريفية الممكن تطبيقها عليها.
  • المعجم يحتوي على من 50.000 مفردة تتوزع على ما لا يقل عن 10.000 فعل عربي، و40.000 اسم وعشرات الحروف والأدوات النحوية وما استثني منها.
  • المفردات مشكولة شكلا تامّا ومرفقة بالمعلومات عن ما يلحقها من زيادات صرفية.

كما يضم المشروع عددا من المعاجم المرافقة مثل:

(more…)

إطلاق مشروع غلطاوي للتصحيح التلقائي

2011/03/08

تم بحمد الله إطلاق مشروع جديد للتصحيح التلقائي، سميناه على بركة الله غلطاوي

التصحيح الإملائي  التلقائي من أهم الأدوات المستعملة في النشر والكتابة الإلكترونية، وتستعمل في البحث والاستعلامات، كما يعد من أهم الأدوات المرافقة للبرامج المكتبية. وفي بعض الحالات نحتاج لما يسمى بالتصحيح التلقائي للكلمات، وهو اقتراح تصحيح لأخطاء شائعة في الكتابة، مثل قلب حرفين، أو عدم الضغط على زر ما لإعطاء كلمة خاطئة، وتشيع في الكتابة بالعربية بعض الأخطاء مثل عدم التفريق بين همزة الوصل وهمزة القطع، والخلط بين الضاد والظاء، وإغفال نقطتي الياء، وكتابة التاء المربوطة هاء.

يهدف هذا المشروع إلى وضع قائمة للكلمات الخاطئة الشائعة وتصحيحها التلقائي، وكذا وضع التعبيرات المنتظمة التي تعبّر عن بعض الحالات.

تطبيقات

  • قائمة التصحيح التلقائي في البرامج المكتبة OpenOffice/LibreOffice
  • تدقيق الأخطاء الشائعة في المواقع ذات المحتوى الضخم، مثل ويكيبيديا.
  • مساعدة الكاتب في برامج المراسلات، والترجمة، وغيرها.
  • تدقيق المدوّنات اللغوية (corpus).
  • تصحيح استعلامات البحث.
  • المساعدة في الكتابة على الأجهزة المحمولة.

الإصدارات

  • قائمة الكلمات للتصحيح التلقائي، بصيغة OpenOffice.org
  • قائمة الكلمات صيغة نصية ملف مضغوط
  • برنامج غلطاوي، لتصحيح الكلمات بواسطة التعابير المنتظمة، وقائمة الكلمات متن بايثون

الأمثلة

أصداء عن قطرب

2009/12/24

نشرت مدونة التكنولوجيا العربية، خبرا عن برنامج قطرب جاء فيه

هل تواجه مشكلة في تصريف الأفعال في اللغة العربية؟  إذاً تستطيع استخدام برنامج قطرب لتحصل على تصريف الأفعال.

موقع قطرب

موقع قطرب

(more…)

مشروع المترادفات Arabic thesaurus project

2009/12/24
يهدف المشروع إلى توفير قائمة بالمترادفات العربية العربية، من أجل
استعمالها في البرامج الحرة، وعلى رأسها البرامج المكتبية مثل
OpenOffice،
يقصد بالمترادفات الكلمات أو العبارات القريبة في المعنى synonyms

 (more...)

قطرب : برنامج لتصريف أفعال اللغة العربية

2009/12/19

كتب بكر التميمي في مدونته

قطرب : برنامج لتصريف أفعال اللغة العربية ، جهد مشترك يقوم به فريق عمل صغير غير أنــّه متميّز جداّ، وتعدّ تجربتة نموذجاً لما يمكن أن ينجزه العمل بروح الفريق و العمل التطوّعي الحر والجهد الجماعي الدؤوب، تابع القراءة

كيف تحمي نفسك من فيروسات أقراص الفلاش؟

2009/03/22

للتقليل من الإصابة بالفيروسات على نظام الوندوز، لا سيما عند إدخال الفلاش ديسك.

– قم بإنشاء حساب محدود
– ضع كلمة سر لحساب مسؤول الكمبيوتر -عند القيام بالأعمال العادية مثل التصفح، كتابة مستند، اللعب…، استعمل دائما الحساب المحدود.
– عند إجراء عمليات على النظام مثل تنصيب البرامج، استعمل حساب مسؤول الكمبيوتر.
– يمكنك أثناء العمل في حساب محدود، أن تنفذ برنامجا ما بواسطة حساب المسؤول دون الحاجة إلى الخروج وذلك بالنقر على البرنامج بزر الفأرة الأيمن، ثم اختر “تشغيل بواسطة”، ثم اختر مسؤول
الكمبيوتر، وقم بإدخال كلمة المرور.
– للتنبيه فهذه الطريقة تحتاج إلى وضع كلمة سر لأحد مسؤولي الكمبيوتر.
– اشرح الطريقة لأفراد عائلتك، وحدثهم عن مزايا العمل في حساب محدود، وأنّ الهدف ليس منعهم من صلاحيات مسؤول الكمبيوتر بل حمايتهم من الفيروسات.

كما ننصح بالآتي:
– قم بفحص جميع الملفات المحملة من الإنترنت، ولا سيما الملفات المقرصنة والموجودة على مواقع التحميل المشترك مثل rapidshare ، ومواقع تحميل الكراك.
– قم بتحميل البرامج المجانية من مواقعها الأصلية.
-استبدل البرامج التجارية المقرصنة المشروخة (التي تحتاج إلى كراك وسريال) ببرامج مفتوحة المصدر مجانية ، يمكن الاطلاع على هذه البرامج في الروابط الآتية:

موقع القرص المفتوح

–   دليل البرامج المفتوحة المصدر

أنا حر أنا مجاني

–  موقع البرامج البديلة