أطلقت Google وكونسورتيوم من المؤسسات البحثية الأفريقية مجموعة بيانات WAXAL، وهي جهد جديد كبير لتصحيح أحد التحديات الرئيسية للذكاء الاصطناعي في القارة، وهو عدم قدرته على تفسير وفهم معظم اللغات الأفريقية.
يقدم المشروع مجموعة بيانات كلام كبيرة ومفتوحة تغطي 21 لغة أفريقية جنوب الصحراء الكبرى وتجلب تقنية الصوت إلى أكثر من 100 مليون شخص مستبعدين من اقتصاد الذكاء الاصطناعي.
مجموعة بيانات WAXAL هي نتاج تعاون استمر ثلاث سنوات بتمويل من Google وبقيادة جامعات محلية ومجموعات مجتمعية.
تتضمن 1,250 ساعة من الكلام الطبيعي المنسوخ وأكثر من 20 ساعة من التسجيلات بجودة الاستوديو تهدف إلى بناء أصوات اصطناعية عالية الدقة. تستهدف لغات مثل الهوسا واليوروبا واللوغندا والإيغبو والأشولي، والتي يتحدث بها الكثير منها عشرات الملايين لكنها تظل غير مرئية إلى حد كبير لأنظمة الكلام التجارية.
على الرغم من كل الحديث عن الذكاء الاصطناعي العالمي، لا تزال تقنيات الصوت تميل بشكل كبير نحو الإنجليزية وحفنة ضيقة من اللغات الأوروبية والآسيوية. أفريقيا، موطن أكثر من 2,000 لغة، تُركت على الهامش.
هذه الفجوة ليست أكاديمية؛ فهي تشكل من يمكنه استخدام الخدمات الرقمية، ومن يمكنه الوصول إلى أدوات التعليم والرعاية الصحية، ومن يمكنه بناء شركات فوق منصات الذكاء الاصطناعي الحديثة. أطرت Google العمل كخطوة نحو تضييق فجوة البيانات طويلة الأمد التي أبقت العديد من اللغات الأفريقية بعيدة عن المساعدين الصوتيين والأدوات الأخرى.
بالإضافة إلى معالجة هذا الخلل مباشرة، يهم المشروع بقدر أهمية البيانات نفسها.
على عكس المبادرات السابقة حيث تم استخراج بيانات الكلام الأفريقية وامتلاكها في مكان آخر، قادت WAXAL على الأرض مؤسسات أفريقية. أشرفت جامعة ماكيريري في أوغندا وجامعة غانا وDigital Umuganda في رواندا على جمع البيانات والمشاركة المجتمعية وإدارة اللغة، بدعم تقني من Google Research Africa.
والأهم من ذلك، تحتفظ هذه المؤسسات بملكية البيانات. هذا تحول ملحوظ في مجال غالباً ما ينتقد لإعادة إنتاج ديناميكيات استخراجية تحت راية الانفتاح.
وفقاً لعائشة والكوت-براينت، رئيسة Google Research Africa، "التأثير النهائي لـ WAXAL هو تمكين الناس في أفريقيا. توفر مجموعة البيانات هذه الأساس الحاسم للطلاب والباحثين ورواد الأعمال لبناء التكنولوجيا بشروطهم الخاصة، بلغاتهم الخاصة، للوصول أخيراً إلى أكثر من 100 مليون شخص."
"نتطلع إلى رؤية المبتكرين الأفارقة يستخدمون هذه البيانات لإنشاء كل شيء من أدوات تعليمية جديدة إلى خدمات صوتية تخلق فرصاً اقتصادية ملموسة عبر القارة"، أضافت.
عائشة والكوت-براينت، رئيسة Google Research Africa
هذا الإطار تردد صداه من قبل الجامعات المشاركة. قالت جويس ناكاتومبا-نابيندي، محاضرة كبيرة في جامعة ماكيريري:
"لكي يكون للذكاء الاصطناعي تأثير حقيقي في أفريقيا، يجب أن يتحدث لغاتنا ويفهم سياقاتنا. تمنح مجموعة بيانات WAXAL باحثينا البيانات عالية الجودة التي يحتاجونها لبناء تقنيات الكلام التي تعكس مجتمعاتنا الفريدة. في أوغندا، عززت بالفعل قدرتنا البحثية المحلية ودعمت مشاريع جديدة يقودها الطلاب وأعضاء هيئة التدريس."
في جامعة غانا، أشار الأستاذ المشارك إسحاق ويافي إلى حجم المشاركة العامة:
"بالنسبة لنا في جامعة غانا، يتجاوز تأثير WAXAL البيانات نفسها. لقد مكننا من بناء موارد لغوية خاصة بنا وتدريب جيل جديد من باحثي الذكاء الاصطناعي. انضم إلينا أكثر من 7,000 متطوع لأنهم أرادوا أن تنتمي أصواتهم ولغاتهم إلى المستقبل الرقمي. اليوم، أشعل هذا الجهد الجماعي نظاماً بيئياً للابتكار في مجالات مثل الصحة والتعليم والزراعة. هذا يثبت أنه عندما توجد البيانات، تتوسع الإمكانيات في كل مكان."
هناك سبب للتفاؤل الحذر. يمكن لمجموعات بيانات الكلام المفتوحة أن تخفض الحواجز أمام الشركات الناشئة المحلية والباحثين الذين يفتقرون إلى الموارد لجمع البيانات على نطاق واسع. يمكنها أيضاً تقليل الاعتماد على واجهات برمجة التطبيقات الأجنبية التي نادراً ما تدعم اللغات الأفريقية بشكل جيد، إن وجدت.
مجموعة بيانات WAXAL
ومع ذلك، لا تضمن مجموعات البيانات النتائج؛ يتطلب بناء أنظمة صوتية موثوقة استثماراً مستداماً ونشراً محلياً ومسارات تجارية تحافظ على القيمة داخل البلد. سيدعو دور Google كممول ومنسق إلى التدقيق، خاصة حول كيفية استخدام بيانات WAXAL من قبل الشركات العالمية في المستقبل.
في الوقت الحالي، يمثل إصدار مجموعة بيانات WAXAL خطوة ملموسة نحو نظام ذكاء اصطناعي أكثر شمولاً لغوياً. إنه لا يحل تحديات الذكاء الاصطناعي في أفريقيا، لكنه يعالج تحدياً أساسياً. غالباً ما يكون الصوت هو الواجهة الأكثر طبيعية مع التكنولوجيا. التأكد من أن الذكاء الاصطناعي يمكنه سماع أفريقيا تتحدث، بكل تنوعها، قد فات أوانه منذ فترة طويلة.
ظهر المنشور Google to train AI in 21 African languages, including Yoruba, Hausa and Igbo لأول مرة على Technext.


