لماذا يرتجف عمالقة الذكاء الاصطناعي من DeepSeek V4 الجديد - تجربة عملية

DeepSeek V4
أعلنت DeepSeek عن نموذج V4 وهو مفتوح المصدر يتكون من النموذج السريع DeepSeek-V4-Flash والنموذج المفكر DeepSeek-V4-Pro الذي يحتوي على 1.6 ترليون (Parameter) وهو قفزة من DeepSeek، مع تحديث نافذة السياق إلى مليون توكن (Context Window) وهو يحتفظ بالمعلومات ويقوم بعمل محادثات طويلة جداً دون فقدان التركيز بفضل معمارية (Engram).

ما الذي يميز نموذج DeepSeek V4 Pro؟

يتميز نموذج DeepSeek V4 برو والذي يمكنك استخدامه عبر واجهة الموقع عبر زر (Expert) بحجم البيانات الضخم الذي تم تدريبه عليها التي تصل إلى 1.6 ترليون (Parameter) مما يجعله موسوعة ضخمة، وليحافظ النموذج على الأداء العالي والسرعة المعقولة في التفكير سيفعل 49 مليار (Parameter) عند التفاعل معه بناءً على تخصص وفئة السؤال الذي طرحته على النموذج، النموذج المفكر مجاني بالكامل عبر موقع DeepSeek، إضافة إلى انه متوفر بإشتراك API للأتمتة ولوكلاء الذكاء الاصطناعي بأسعار معقولة مقارنة بالنماذج المفكرة من الشركات الأخرى.

ما هي نقاط قوة DeepSeek الإصدار الرابع؟

قامت شركة DeepSeek بعمل إختبارات للنموذج مقارنة بأشهر نماذج الذكاء الاصطناعي الأخرى لتحديد نقاط القوة، الأختبارات الأولى تتعلق بالمعرفة والاستنتاج، أولها اختبار (SimpleQA Verified) الذي يفحص قدرة النموذج على الإجابة على أسئلة قصيرة بدقة بدون هلوسة حيث تفوق Gemini-3.1-Pro-High هنا بنسبة 75.6%، اما اختبار المنطق المعقد (HLE) كانت النتائج متقاربة لكن تفوق Gemini بفرق بسيط، تميز DeepSeek في اختبار البرمجة والرياضيات (Apex Shortlist) يتصدر DeepSeek-V4-Pro-Max بنسبة 90.2% مما يظهر قوته في البرمجة والرياضيات المعقدة، وتصدر بـ 3206 نقطة في تقييم (Codeforces) للبرمجة، هذه الاختبارات للنموذج كمساعد دردشة في الاستخدامات التقليدية اليومية.

أما في الاستخدامات الاحترافية وبناء وكلاء ذكاء اصطناعي (AI Agent) نبدأ باختبار (SWE Verified) وهو يختبر قدرة النموذج على إصلاح الأخطاء البرمجية في المشاريع نلاحظ أن DeepSeek يحقق 80.6% وهو أداء عالي يدل على  قدراته البرمجية، أما اختبار (Terminal Bench 2.0) الذي يختبر قدرته على التحكم في النظام واستخدام (Terminal) تفوق شات جي بي تي GPT-5.4-xHigh بنسبة 75.1% وتفوق كذلك في اختبار (Toolathlon) الذي يختبر قدرة النماذج على التعامل مع الأدوات (Tools) والإتصال بالتطبيقات عبر (API).

رابط النموذج: DeepSeek

DeepSeek V4 Benchmark


 
إقرأ ايضًا:


شارك المقالة مع أصدقائك