2024-01-15
完全な分析動画を見る:
紹介と特徴
- バージョン:DeepSeek V3
 - 性能:V2より3倍高速
 - APA互換性:完全
 - オープンソースモデル:Claude 3.5 Sonnetと同等、Claude 30 Sonnetを超える
 - モデル規模:671億の混合エキスパートモデル、370億のアクティブパラメータ
 - 学習データ:14兆の高品質トークン
 - コスト効率:2月8日以前は最低コストの一つ
 
性能比較
- 数学ベンチマーク:DeepSeekは90点を獲得、GPT-40の74.6点を上回る
 - 言語理解:DeepSeekは複数のベンチマークテストで優れた成果
 
アーキテクチャと技術
- 基本アーキテクチャ:Transformerブロック、混合エキスパート(MoE)
 - アテンション機構:マルチヘッド潜在アテンション、128,000トークンをサポート
 - メモリ能力:長いシーケンスのすべての情報を記憶可能
 
プログラミングテスト
- Pythonテスト:単位行列生成、最小公倍数、Faray数列、ECG数列などの挑戦的な問題
 - JavaScriptテスト:ヨセフスの問題などの高度な課題
 - 結果:DeepSeekは専門家レベルのテストで優れた成果を示し、エラーを解決し、ほとんどの課題をクリア
 
論理と推論テスト
- 論理問題:"strawberry"の中の"O"の数を数えるなど
 - 推論能力:一連の論理問題を成功裏に解決
 
自律行動テスト
- エージェント行動:Praise AIパッケージを使用したテスト
 - タスク例:迷子の猫に関する映画脚本の作成
 - 結果:エージェントが協力して検索ツールを活用し、タスクを完了
 
誤導テスト
- シナリオテスト:Runway trolley問題
 - 結果:DeepSeekは道徳的判断の処理に限界を示す
 
まとめ
- DeepSeek V3はClaude 3.5 Sonnetと同等で、一部のベンチマークではより優れている
 - オープンソース、コスト効率が高く、専門家レベルのプログラミングと論理的推論テストで優れている
 - 自律行動能力は優れているが、誤導テストでは課題に直面
 
行動喚起
- YouTubeチャンネルを購読:AIの発展についてもっと学ぶ
 - 他の動画を見る:OpenAIのReason Lモデルのリリースについて