شهد العقدان الأخيران من القرن العشرين والأول من القرن الحادي والعشرين العصر الذهبي لتطوير البرمجيات العربية من قبل الشركات العربية.
خلال تلك الفترة ، ظهرت برامج النشر المكتبي ، والتدقيق الإملائي والنحوي ، وتحويل الكلام العربي المنطوق إلى نص والعكس ، والتعرف الضوئي على الحروف ، والإملاء الصوتي ، ومحركات البحث ، والترجمة من وإلى العربية.
ورافق ذلك ظهور بوابات عربية كبيرة وواعدة على الإنترنت ، مثل “أرابيا أون لاين” و “الشبكة العربية” و “عجيب” ، اختفت جميعها فيما بعد.
المدققات الإملائية والنحوية العربية
شهدت الثمانينيات والتسعينيات من القرن الماضي تطوير وإطلاق العديد من أدوات التدقيق الإملائي والقواعد العربية ، كان من أبرزها الشركة العربية لأنظمة المعلومات التي أسسها علاء الدين صلاح العجموي عام 1982 ، والتي طورت المدقق الإملائي. لأجهزة Macintosh ، و “صخر” لبرامج الكمبيوتر التي أسسها محمد الشارخ عام 1982 ، والتي قمت بتطوير مدقق إملائي للأجهزة التي تعمل بنظام DOS ومن ثم Windows. قامت شركة Coltech المصرية ، التي أسستها الدكتورة تغريد السيد عنبر في عام 1990 لتطوير تقنيات اللغة العربية ، بتطوير مدقق إملائي لنظام Windows.
الشركات العربية التي طورت هذه التقنيات اللغوية لم تتمكن من الوصول إلى كبرى الشركات العالمية ، باستثناء الأخيرة التي نجحت في بيع مدققها الإملائي العربي إلى مايكروسوفت في عام 1997 ، عندما تم دمجها مع مجموعة Office 97 ، ثم إرفاقها بـ المدقق النحوي العربي ضمن مجموعة Office 2000. التعامل مع شركة “كولتك” خلال العقد الثاني من القرن الحادي والعشرين ، وشكلت فريقها الخاص لمتابعة العمل على لعبة المدقق العربي للتهجئة والقواعد.
محركات البحث العربية
طورت العديد من الشركات العربية محركات بحث للإنترنت ، منها محرك “أين” الذي انطلق عام 1997 وأغلق عام 2012 ، ومحرك “العربي” الذي انطلق عام 2006 وأغلق عام 2009 ، ومحرك “أنكيش” الذي تم إطلاقه. في عام 2007 وأغلق في عام 2010.
ولم تستطع تلك التجارب منافسة محركات البحث العالمية وخاصة محرك البحث جوجل الذي انطلق عام 1998 وبدأ في دعم اللغة العربية عام 2002.
طورت شركة صخر محرك البحث “الإدريسي” الذي استخدمته العديد من الشركات وبعض المواقع الإلكترونية ، وعلى الرغم من جودته في معالجة اللغة العربية ، إلا أنه لم يتحول إلى محرك بحث شامل للإنترنت ، حيث أن جودة اللغة المعالجة ليست كافية للنجاح ، لأن البحث على الإنترنت يتطلب العديد من التقنيات. البعض الآخر ، مثل الزاحف ، الذي يبحث ويفهرس جميع بلايين صفحات الإنترنت ، ويتعرف على الصفحات الفاسدة ويتجنبها ، ويحدد لغة كل صفحة ، ويحدد ويستخرج حدود النصوص والمقالات ، ويحدد اسم المؤلف ، ويتعرف على الصور ، حدودها وألقابها.
ومن بين التقنيات الأساسية الأخرى التي يتطلبها محرك البحث ترتيب نتائج البحث على أفضل وجه ممكن ، والتي تتضمن عشرات المتغيرات ، مما جعل محرك بحث Google الأول في العالم بعد وقت قصير من إطلاقه.
كما أن تطوير محرك بحث للإنترنت يتطلب استثمارًا كبيرًا. جوجل ، على سبيل المثال ، حصلت على تمويل بقيمة 25 مليون دولار بعد أقل من عام من إطلاقها ، ثم حصلت على 25 مليون دولار إضافية في العام التالي ، من خلال أصحاب رؤوس الأموال من القطاع الخاص ، والذي لم يكن متاحًا للأسف في الدول العربية.
كان من المفترض أن تدعم الجهات الحكومية العربية أحد محركات البحث العربية التي تم إنشاؤها وتساهم في تمويله حتى ينمو ويكون قادرًا على اقتطاع حصة جيدة من السوق المتعلقة بالبحث على الإنترنت باللغة العربية. على الأقل. لم يكن محرك البحث الصيني “بايدو” الذي انطلق عام 2000 ليحقق النجاح الكبير الذي حققه لولا الدعم الحكومي وضخ ملايين الدولارات فيه. الأمر نفسه ينطبق على محرك البحث الروسي “ياندكس”.
الترجمة من والى اللغة العربية
في عام 2000 ، أطلقت ATA موقع المسبار.www.almisbar.com) لترجمة النصوص والمواقع من الإنجليزية إلى العربية. في نفس العام ، أطلقت صخر موقعها الإلكتروني للترجمة من الإنجليزية إلى العربية (Tarjim.com). كان الموقعان واعدان ، إلى أن أنهت Google العصر الذهبي لبرامج الترجمة العربية في أبريل 2005 ، بعد أن تفوقت أداة Google Translate الإحصائية المطورة حديثًا على ترجمة صخر وبرامج الترجمة الأخرى في الاختبارات التي أجراها المعهد المنوعاتي الأمريكي للمعايير والتكنولوجيا (NIST).
وظفت Google الكم الهائل من المحتوى الذي جمعته عبر محرك البحث ، لتطوير محرك الترجمة الإحصائية من الإنجليزية إلى العربية والعكس ، الأمر الذي كان صعبًا على الشركات العربية ، بسبب افتقارها إلى هذا الكم من المحتوى.
تمكنت العديد من الشركات العالمية لاحقًا من تطوير محركات ترجمة من الإنجليزية إلى العربية والعكس ، بقيادة شركة Microsoft ، نظرًا لامتلاكها قدرًا من المحتوى مشابهًا لمحتوى Google.
شهد العقد الثاني من القرن الحادي والعشرين نقل تطوير العديد من تقنيات اللغة العربية المستخدمة على نطاق واسع من الشركات العربية إلى الشركات العالمية التي تبنت تطوير هذه التقنيات بمساعدة خبراء عرب. ولم يقتصر الأمر على التقنيات التي ناقشناها سابقًا ، بل شمل أيضًا التعرف على الصوت العربي ، والإملاء الصوتي الآلي ، والقارئ الآلي للصور ، وتحويل الكلام العربي المنطوق إلى نص ، والعكس صحيح.
هل الفرصة ما زالت متاحة للدول العربية للعمل على تطوير تقنيات اللغة العربية؟
الجواب نعم. في سبتمبر 2022 ، أطلق الاتحاد الأوروبي مشروع إنشاء محرك بحث أوروبي للإنترنت (OpenWebSearch.eu). السبب المعلن لهذا المشروع هو القلق الناشئ عن عدم التوازن في سوق محركات البحث حيث تهيمن العديد من الشركات مثل Google و Microsoft و Baidu و Yandex على محتوى الإنترنت ، مما يهدد دمقرطة المحتوى ويحد من إمكانات الابتكار الأوروبية.
الحاجة إلى تطوير تقنيات اللغة العربية أكبر من الحاجة الأوروبية ، لكنها تتطلب إنشاء مركز عربي متخصص في ذلك ، مدعومًا من عدة دول عربية ، خاصة الغنية منها ، يستخدم الكم الهائل من المحتوى العربي المتاح حاليًا ، ابتكار طرق جديدة وفعالة لمعالجة القضايا المعقدة للغة العربية ، بما في ذلك الموسيقى العربية والخطوط العربية.