أثارت تقنية طورتها شركة DeepSeek
الصينية الناشئة في مجال
الذكاء الاصطناعي جدلًا علميًا واسعًا، بعد أن شككت دراسة بحثية جديدة في قدرتها المعلنة على تحسين تعامل نماذج الذكاء الاصطناعي مع النصوص الطويلة، في واحدة من الحالات النادرة التي تُواجَه فيها أبحاث الشركة بانتقاد علني.
الدراسة، التي أعدها باحثون من جامعة توهوكو
اليابانية والأكاديمية الصينية للعلوم، تناولت تقنية DeepSeek-OCR، وهي طريقة تعتمد على تمثيل النصوص بصريًا بهدف ضغطها، ما يُفترض أن يساعد نماذج الذكاء الاصطناعي على تجاوز ما يُعرف بـ«عنق زجاجة السياق الطويل».
ما هي تقنية DeepSeek-OCR؟
كشفت DeepSeek عن هذه التقنية في أكتوبر الماضي، ووصفتها بأنها قادرة على إحداث نقلة نوعية في معالجة المستندات الكبيرة والمعقدة، عبر استخدام الإدراك البصري كوسيط ضغط للنصوص، ووفقًا للشركة، يمكن لهذه الطريقة تقليل عدد الرموز النصية (Tokens) بمعدل يتراوح بين 7 و20 مرة.
لكن الدراسة الجديدة، التي حملت عنوان «قيمة بصرية أم عكاز لغوي؟ نظرة متعمقة على DeepSeek-OCR»، خلصت إلى أن أداء التقنية كان غير متسق، وأنها تعتمد بشكل كبير على ما يُعرف بـ«الأسبقيات اللغوية»، أي الأنماط التي تعلمتها النماذج من كميات هائلة من النصوص، بدلًا من الفهم البصري الحقيقي الذي ادعت التقنية تقديمه.
ووصف الباحثون مؤشرات الأداء التي أعلنتها DeepSeek بأنها «مضللة»، مشيرين إلى أن دقة الإجابة عن الأسئلة البصرية انخفضت إلى نحو 20% عندما أُضيف نص إضافي يمكن أن يؤثر على الاستدلال، مقارنةً بأكثر من 90% لدى نماذج ذكاء اصطناعي تقليدية.
أوضح الباحثون أن نماذج الذكاء الاصطناعي لا تزال تعاني من قيود جوهرية في معالجة المستندات الطويلة أو الحوارات الممتدة، وهي مشكلة تسعى شركات ومراكز أبحاث حول العالم إلى حلها، إلا أن نتائج الدراسة تطرح تساؤلات جوهرية حول ما إذا كانت تقنيات الضغط البصري الحالية تمثل فعلًا مسارًا عمليًا لتجاوز هذه القيود.
لم ترد شركة DeepSeek فورًا على طلب للتعليق، لكن بعض خبراء علوم الحاسوب اعتبروا أن التقنية ليست فشلًا بقدر ما هي سلاح ذو حدين،
وقال لي بوجييه، الحاصل على دكتوراه في علوم الحاسوب من
جامعة العلوم والتكنولوجيا الصينية، والذي يدير حاليًا شركة ناشئة في
بكين، إن الاعتماد على المعرفة المكتسبة قد يكون مفيدًا عند التعامل مع مخطوطات غير واضحة، لكنه قد يتحول إلى نقطة ضعف عند قراءة نصوص مطبوعة بوضوح، وأضاف: «يمكن القول إن لهذه الطريقة مزاياها وعيوبها في الوقت نفسه».
تُظهر هذه الدراسة أن السباق لتحسين قدرات الذكاء الاصطناعي في فهم النصوص الطويلة لا يزال مفتوحًا، وأنه لا توجد حتى الآن «حلول سحرية» تناسب جميع الحالات، ما يدفع الباحثين إلى البحث عن استراتيجيات بديلة وأكثر موثوقية. (اليوم السابع)