2024-01-15
شاهد التحليل الكامل:
المقدمة والميزات
- الإصدار: DeepSeek V3
 - الأداء: أسرع 3 مرات من V2
 - توافق APA: كامل
 - نموذج مفتوح المصدر: يعادل Claude 3.5 Sonnet، ويتفوق على Claude 30 Sonnet
 - حجم النموذج: 67.1 مليار نموذج خبراء مختلط، 37 مليار معامل نشط
 - بيانات التدريب: 14 تريليون رمز عالي الجودة
 - فعالية التكلفة: من أقل التكاليف، خاصة قبل 8 فبراير
 
مقارنة الأداء
- اختبار الرياضيات المعياري: حصل DeepSeek على 90، متفوقاً على GPT-40 بنتيجة 74.6
 - فهم اللغة: يتفوق DeepSeek في العديد من الاختبارات المعيارية
 
الهيكلية والتكنولوجيا
- الهيكلية الأساسية: كتل Transformer، مزيج من الخبراء (MoE)
 - آلية الانتباه: انتباه كامن متعدد الرؤوس، يدعم 128,000 رمز
 - قدرة الذاكرة: قادر على تذكر كل بت معلومات في التسلسلات الطويلة
 
اختبارات البرمجة
- اختبارات Python: مشاكل صعبة تشمل توليد المصفوفة الوحدوية، المضاعف المشترك الأصغر، متتالية Faray ومتتالية ECG
 - اختبارات JavaScript: تحديات متقدمة مثل مشكلة Josephus
 - النتائج: يؤدي DeepSeek بشكل ممتاز في اختبارات المستوى المتقدم، ويحل الأخطاء ويجتاز معظم التحديات
 
اختبارات المنطق والاستدلال
- المشاكل المنطقية: مثل عد عدد حرف "O" في كلمة "strawberry"
 - قدرة الاستدلال: يحل بنجاح سلسلة من المشاكل المنطقية
 
اختبارات السلوك المستقل
- سلوك الوكيل: تم اختباره باستخدام حزمة Praise AI
 - مثال على المهمة: إنشاء سيناريو فيلم عن قطة ضائعة
 - النتائج: يعمل الوكلاء بشكل تعاوني، باستخدام أدوات البحث وإكمال المهام
 
اختبارات التضليل
- اختبار السيناريو: مشكلة عربة Runway
 - النتائج: يظهر DeepSeek قيوداً في معالجة الأحكام الأخلاقية
 
الملخص
- DeepSeek V3 يعادل Claude 3.5 Sonnet، ويتفوق في بعض الاختبارات المعيارية
 - مفتوح المصدر، فعال من حيث التكلفة، ويتفوق في اختبارات البرمجة والاستدلال المنطقي المتقدمة
 - قدرات سلوك مستقل جيدة ولكن يواجه تحديات في اختبارات التضليل
 
دعوة للعمل
- اشترك في قناة YouTube: تعرف على المزيد حول تطورات الذكاء الاصطناعي
 - شاهد مقاطع الفيديو الأخرى: حول إصدار نموذج Reason L من OpenAI