
مصر27 يناير(سياحة) – بعد قرابة عامين من توقعات أطلقها الرئيس التنفيذي لشركة مايكروسوفت ساتيا ناديلا حول سيطرة الذكاء الاصطناعي التوليدي على “أعمال المعرفة”، لا يزال الواقع داخل مكاتب المحاماة والبنوك الاستثمارية مختلفاً تماماً، حيث يحتفظ البشر بدورهم الأساسي.
ودراسة حديثة تفسر بوضوح سبب تعثر ثورة الاستبدال الموعودة: الذكاء الاصطناعي لا يجيد التعامل مع فوضى العمل الحقيقي.
كشفت شركة ميركور المتخصصة في بيانات التدريب عن معيار جديد يحمل اسم APEX-Agents، وهو اختبار بعيد كل البعد عن المهام التقليدية التي تتباهى فيها نماذج الذكاء الاصطناعي بكتابة القصائد أو حل المعادلات.
اعتمد الاختبار على طلبات واقعية من محامين ومستشارين وبنكيين، وطلب من النماذج تنفيذ مهام كاملة متعددة الخطوات، تتطلب التنقل بين أنواع مختلفة من البيانات والمصادر.
النتائج كانت صادمة: حتى أقوى النماذج المتاحة حالياً، مثل Gemini 3 Flash وGPT-5.2، لم تتمكن من تجاوز حاجز 25% من الدقة.
وجاء جيميني في الصدارة بنسبة 24%، يليه GPT-5.2 بنسبة 23%، بينما علقت بقية النماذج في نطاق أقل من ذلك بكثير.










