2025-01-10
تحلیل کامل را تماشا کنید:
مقدمه و ویژگیها
- نسخه: DeepSeek V3
 - عملکرد: ۳ برابر سریعتر از V2
 - سازگاری APA: کامل
 - مدل متنباز: برابر با Claude 3.5 Sonnet، برتر از Claude 30 Sonnet
 - مقیاس مدل: ۶۷.۱ میلیارد مدل ترکیبی متخصصان، ۳۷ میلیارد پارامتر فعال
 - دادههای آموزشی: ۱۴ تریلیون توکن با کیفیت بالا
 - مقرون به صرفه: یکی از کمهزینهترینها، بهویژه قبل از ۸ فوریه
 
مقایسه عملکرد
- معیار ریاضی: DeepSeek نمره ۹۰ را کسب میکند، بالاتر از نمره ۷۴.۶ GPT-40
 - درک زبان: DeepSeek در چندین آزمون معیار برتری دارد
 
معماری و فناوری
- معماری پایه: بلوکهای Transformer، ترکیب متخصصان (MoE)
 - مکانیزم توجه: توجه نهفته چندسر، پشتیبانی از ۱۲۸,۰۰۰ توکن
 - قابلیت حافظه: توانایی به یاد سپردن هر بیت اطلاعات در توالیهای طولانی
 
آزمونهای برنامهنویسی
- آزمونهای پایتون: مسائل چالشبرانگیز شامل تولید ماتریس واحد، ک.م.م، دنباله Faray و دنباله ECG
 - آزمونهای جاوااسکریپت: چالشهای پیشرفته مانند مسئله Josephus
 - نتایج: DeepSeek در آزمونهای سطح متخصص عملکرد عالی دارد، رفع خطاها و عبور از اکثر چالشها
 
آزمونهای منطق و استدلال
- مسائل منطقی: مانند شمارش تعداد "O" در کلمه "strawberry"
 - توانایی استدلال: حل موفقیتآمیز مجموعهای از مسائل منطقی
 
آزمونهای رفتار خودمختار
- رفتار عامل: آزمایش با استفاده از بسته Praise AI
 - مثال وظیفه: ایجاد فیلمنامه درباره گربه گمشده
 - نتایج: عاملها به صورت مشارکتی کار میکنند، استفاده از ابزارهای جستجو و تکمیل وظایف
 
آزمونهای گمراهکننده
- آزمون سناریو: مسئله تراموای Runway
 - نتایج: DeepSeek محدودیتهایی در مدیریت قضاوتهای اخلاقی نشان میدهد
 
خلاصه
- DeepSeek V3 برابر با Claude 3.5 Sonnet است، در برخی معیارها برتری دارد
 - متنباز، مقرون به صرفه و برتر در آزمونهای برنامهنویسی سطح متخصص و استدلال منطقی
 - قابلیتهای رفتار خودمختار خوب اما با چالشهایی در آزمونهای گمراهکننده مواجه است
 
فراخوان به عمل
- عضویت در کانال یوتیوب: اطلاع از پیشرفتهای هوش مصنوعی
 - تماشای ویدیوهای دیگر: درباره انتشار مدل Reason L از OpenAI