الذكاء الاصطناعي متعدد الوسائط: أنظمة النصوص والصور والصوت | GAUAB