国产办公室秘书无码精品99_免费无码中文字幕A级毛片_AA区一区二区三无码精片_久久青青草原亚洲av无码app

DeepSeek的一次小更新:暴打OpenAI 追上Gemini

壞消息,次打開源模型和閉源模型的小更新暴差距越來越大了。

好消息,次打DeepSeek 又出手了。小更新暴

12 月 1 日,次打DeepSeek 發(fā)布了兩款新模型 —— DeepSeek V3.2 和 DeepSeek-V3.2-Speciale。小更新暴

前者和 GPT-5 能打的次打有來有回,后面的小更新暴高性能版更是直接把 GPT 爆了,開始和閉源模型天花板 —— Gemini 打了個五五開。次打

還在IMO 2025(國際數(shù)學(xué)奧林匹克)、小更新暴CMO 2025(中國數(shù)學(xué)奧林匹克)等一系列比賽中拿下金牌。次打

這是小更新暴這家公司今年第九次發(fā)布模型,雖然大家期待的次打 R2 還沒有來。

所以,小更新暴DeepSeek 是次打怎么用更小的數(shù)據(jù),更少的顯卡,做出能和國際巨頭來抗衡的模型?

我們翻開了他們的論文,想把這件事給大家講清楚。

為了做到這個目標(biāo),DeepSeek 又整了不少新招:

先是把咱們的老朋友 DSA —— 稀疏注意力給轉(zhuǎn)正了。

這東西在之前的 V3.2-EXP 版本里出現(xiàn)過,當(dāng)時只是測了一下 DSA 會不會影響模型的性能,現(xiàn)在是真的把這玩意給放到了主力模型上。

大家平時和大模型聊天的時候會發(fā)現(xiàn),你在一個對話框里聊的越多,模型就越容易胡言亂語。

甚至聊的太多了,還會直接不讓你聊了。

這是因為大模型原生的注意力機制導(dǎo)致的問題,在這套老邏輯的影響下,每個 token 出來,都要和前面的每一個 token 互相算在一起做一次計算。

這就導(dǎo)致了句子增長一倍,模型的計算量就得增加到原來的四倍,如果邊長到原來的三倍,計算量就變成了原來的九倍,非常麻煩。

DeepSeek 想這樣不行啊,于是就給大模型里加了固定頁數(shù)的目錄(稀疏注意力),相當(dāng)于幫模型劃重點了。

而在有了目錄之后,以后每次只需要計算這個 token 和這些目錄的關(guān)系就行了,相當(dāng)于就是看書先讀目錄,看完目錄,對哪一章感興趣,再去仔細看這章的內(nèi)容就好。

這樣一來,就能讓大模型讀長文的能力變的更強。

在下面這張圖里可以看到,隨著句子越來越長,傳統(tǒng)的 V3.1 的推理成本是越來越高。

但是用上了稀疏注意力的 3.2 則沒什么變化。。。

屬于是超級省錢冠軍了。

另一方面,DeepSeek 開始重視起了開源模型的后訓(xùn)練工作。

大模型這一套從預(yù)訓(xùn)練開始,到考試打分的過程,其實有點像是我們?nèi)祟悘男W(xué)開始,一路讀書讀到高考的過程。

前面的大規(guī)模預(yù)訓(xùn)練,相當(dāng)于從小學(xué)到高二,把所有課本、練習(xí)冊、卷子全過一遍,這一步大家都差不多,不管是閉源模型,還是開源模型,都在老老實實的念書。

但到了高考沖刺階段就不一樣了,在模型的后訓(xùn)練階段,閉源模型一般都會請名師,猛刷題,開始搞起各種強化學(xué)習(xí),最后讓模型來考一個不錯的成果。

但開源模型在這塊花的心思就比較少了,按照 DeepSeek 的說法,過去的開源模型在訓(xùn)練后階段計算投入普遍偏低。

這就導(dǎo)致這些模型可能基礎(chǔ)能力是已經(jīng)到位的了,但就是難題刷少了,結(jié)果導(dǎo)致考出來的成績不太好。

于是,DeepSeek 決定這次自己也要上名師輔導(dǎo)班,設(shè)計了一套新的強化學(xué)習(xí)協(xié)議,在預(yù)訓(xùn)練結(jié)束后,花了超過總訓(xùn)練算力的 10% 來給模型開小灶,把之前缺的這塊給補上。

同時還推出了個能思考超長時間的特殊版本 —— DeepSeek V3.2 Speciale。

這玩意的思路是這樣的:

過去的大模型因為上下文長度有限制,所以在訓(xùn)練的時候都會做一些標(biāo)注懲罰的工作,如果模型深度思考的內(nèi)容太長了,那就會扣分。

而到了 DeepSeek V3.2 Speciale 這兒,所以 DeepSeek 干脆取消掉了這個扣分項,反而鼓勵模型想思考多久就思考多久,想怎么思考就怎么思考。

最終,讓這個全新的 DeepSeek V3.2 Speciale 成功的和前幾天爆火的 Gemini 3 打的有來有回。

此外DeepSeek 還很重視模型在智能體方面能力。

一方面,為了提高模型的基礎(chǔ)能力,DeepSeek 構(gòu)建了一個虛擬環(huán)境,合成了成千上萬條數(shù)據(jù)來輔助訓(xùn)練。

DeepSeek-V3.2 用 24667 個真實代碼環(huán)境任務(wù)、50275 個真實搜索任務(wù)、4417 個合成通用 agent 場景、5908 個真實的代碼解釋任務(wù)做后訓(xùn)練。

另一方面,DeepSeek 還優(yōu)化了模型使用各種工具的流程。

以前幾代 DeepSeek 的一個典型毛病是:會把思考和用工具給分開。

模型一旦去調(diào)用外部工具,前面那段思考基本就算寫完收工了,等工具查完結(jié)果再回來,它往往又要重新鋪一遍思路。

這就導(dǎo)致一種很蠢的體驗——哪怕只是去查一下“今天幾月幾號” 這種小事,模型也會從頭開始重建整套推理鏈,非常浪費時間。。。

在 V3.2 這里,DeepSeek 忍不了了,直接把這套邏輯推翻重做。

現(xiàn)在的規(guī)則變成:在一整串工具調(diào)用的過程中,模型的“思考過程”會一直保留下來,只有當(dāng)用戶發(fā)來一條新的提問時,才會重置這一輪推理;而工具的調(diào)用記錄和結(jié)果,會像聊天記錄一樣一直留在上下文里。

通過這修改模型架構(gòu),重視后訓(xùn)練,強化 Agent 能力的三板斧,DeepSeek 才終于讓自己的新模型,有了能和世界頂尖開源模型再次一戰(zhàn)的能力。

當(dāng)然,即使做了這么多改進,DeepSeek 的表現(xiàn)也算不上完美。

但托尼最喜歡 DeepSeek 的一點,就是他們愿意承認自己的不足。

而且還會直接在論文里寫出來。

比如這次論文就提到了,這次的 DeepSeek V3.2 Speciale 雖然能和谷歌的 Gemini 3 Pro 來打的五五開。

但是要回答相同的問題,DeepSeek 需要花費更多的 token。

我自己也測試了一下,從“人類的最終考試” 的題庫里隨便抽了道題目,同時丟給 Gemini 3 Pro 和 DeepSeek V3.2 Speciale 這兩個模型。

題目是:

蜂鳥類在足形目中獨特地擁有雙側(cè)成對的橢圓形骨,這是一種嵌入在膨脹的十字翼腱膜的尾狀骨中,嵌入壓低多粒骨的尾狀骨。這塊籽骨支撐著多少對對腱?請用數(shù)字回答。

結(jié)果發(fā)現(xiàn) Gemini 只要 4972 個 Tokens 就能把問題給答出來。

而到了 DeepSeek 這邊,則用了 8077 個 Tokens 才把問題給搞明白。

光看用量的話,DeepSeek 的的 Tokens 消耗量高了快六成,確實是有不小的差距。

但是話又說回來了。

DeepSeek 雖然消耗的 token 多,但是人家價格便宜啊。。。

還是剛才那個問題,我回頭仔細看了眼賬單。

DeepSeek 8000 多個 tokens,花了我 0.0032 美元。

但谷歌這邊,5000 個 tokens 不到,給我干掉了 0.06 刀?這塊要比 DeepSeek 高了有 20 倍了。

從這個角度上來看,怎么感覺還是 DeepSeek 更香一些。。。

最后,讓我們回到論文的開頭。

正如 DeepSeek 所言,最近半年來,開源模型和閉源模型的差距正在不斷加大。

但他們還是用自己的方式,在不斷追趕這份差距。

而 DeepSeek 的各種節(jié)省算力,節(jié)約數(shù)據(jù)的操作,其實讓我想到了上個月,一場關(guān)于 Ilya Sutskever 的訪談。

這位 OpenAI 曾經(jīng)的靈魂人物認為,只靠一味的給模型堆參數(shù),是沒有未來的。

AlexNet只用了兩塊GPU。Transformer剛出現(xiàn)時的實驗規(guī)模,大多在8~64塊GPU范圍內(nèi)。按今天的標(biāo)準(zhǔn)看,那甚至相當(dāng)于幾塊GPU的規(guī)模,ResNet也一樣。沒有哪篇論文靠龐大的集群才能完成。

比起算力的堆砌,對算法的研究也一樣重要。

這正是 DeepSeek 在做的事情。

從 V2 的 MoE,到 V3 的多頭潛在注意力(MLA),再到如今 DeepSeek Math V2 的自驗證機制,V3.2 的稀疏注意力(DSA)。

DeepSeek 展現(xiàn)給我們進步,從來都不是單一的,依靠堆砌參數(shù)規(guī)模所帶來的提升。

而是在想辦法,如何用有限的數(shù)據(jù),來堆積出更多的智能。

巧婦狂作無米之炊

所以,R2 什么時候來呢?

推薦內(nèi)容
国产办公室秘书无码精品99_免费无码中文字幕A级毛片_AA区一区二区三无码精片_久久青青草原亚洲av无码app

      www.亚洲天堂网| 伊人网在线免费| 男的插女的下面视频| 国产麻豆电影在线观看| 激情视频免费网站| 成人午夜视频免费在线观看| 8x8x华人在线| 国产麻花豆剧传媒精品mv在线| 一级黄色高清视频| 一级做a免费视频| 亚洲欧美国产日韩综合| 国产激情片在线观看| 国产九九热视频| 国产情侣第一页| 18禁免费观看网站| 国产在线青青草| 黄色a级在线观看| 国产一二三区在线播放| 日本三级免费网站| 成人性做爰aaa片免费看不忠| 天天影视综合色| 国产成年人在线观看| www.欧美日本| 亚洲熟妇无码另类久久久| 亚洲国产精品女人| 91精品无人成人www| 国产xxxxx在线观看| 五月天在线免费视频| 邪恶网站在线观看| 色欲av无码一区二区人妻| 人人妻人人澡人人爽欧美一区| 亚洲黄色网址在线观看| 欧美性久久久久| 黄色片免费网址| 超碰在线97免费| 国产在线播放观看| 视色视频在线观看| 免费大片在线观看| 妺妺窝人体色www在线小说| 免费网站在线观看视频| 喜爱夜蒲2在线| 99中文字幕在线观看| 欧洲xxxxx| 久久久福利影院| 熟女少妇在线视频播放| japanese在线播放| 国产成人精品免费看在线播放| av噜噜在线观看| 潘金莲激情呻吟欲求不满视频| 少妇大叫太大太粗太爽了a片小说| 超碰中文字幕在线观看| 777一区二区| 亚洲日本黄色片| 天堂网成人在线| 97超碰免费观看| 51xx午夜影福利| 免费看日本黄色| 老子影院午夜伦不卡大全| 老子影院午夜伦不卡大全| 青青青在线观看视频| 国产精品日韩三级| 欧美成人三级在线视频| 日韩av综合在线观看| 欧美日韩成人免费视频| 1024精品视频| 久久久久国产精品熟女影院| 国产成人手机视频| 久久国产精品免费观看| 国模无码视频一区二区三区| 久久国产精品网| 可以在线看的av网站| 激情伊人五月天| 久久久久狠狠高潮亚洲精品| 热久久精品免费视频| 亚洲欧美国产中文| 日本一二三四区视频| 黄色录像特级片| 国产九色porny| 浮妇高潮喷白浆视频| 欧美激情成人网| 激情黄色小视频| 蜜桃视频一区二区在线观看| www.爱色av.com| 最新天堂在线视频| 女人床在线观看| 精品久久久久久无码国产| 超碰超碰在线观看| 日韩一级特黄毛片| 成人精品视频一区二区| 久久久福利影院| 日韩免费一级视频| 日韩欧美亚洲另类| 国产精品国产对白熟妇| 国产又大又黄又粗的视频| 午夜久久久久久久久久久| 久久美女福利视频| 久久久一二三四| 水蜜桃色314在线观看| 欧美美女性视频| 国产精品裸体瑜伽视频| 中文字幕亚洲影院| 日韩中文字幕在线视频观看| 手机av在线网站| 国产3p露脸普通话对白| 奇米精品一区二区三区| 欧美成人黑人猛交| 性做爰过程免费播放| 国产二区视频在线播放| 一本—道久久a久久精品蜜桃| 少妇高潮喷水在线观看| 成人3d动漫一区二区三区| 丰满人妻一区二区三区53号| 动漫av免费观看| av片在线免费| 成人综合久久网| 浮妇高潮喷白浆视频| 香蕉视频xxxx| 手机成人av在线| 蜜臀av无码一区二区三区| www.色.com| 欧美三级理论片| 国产亚洲精品网站| 大胆欧美熟妇xx| 国产探花在线观看视频| 无码人妻丰满熟妇区五十路百度| 成人在线免费观看网址| www.涩涩涩| wwwxxx黄色片| 日韩精品综合在线| 亚洲 欧洲 日韩| 午夜免费看毛片| 看欧美ab黄色大片视频免费| 九九爱精品视频| 亚洲精品国产suv一区88| 亚洲一级片av| 一级片视频免费观看| 黄色a级片免费| 91丨porny丨探花| 欧美精品在欧美一区二区| 一级全黄肉体裸体全过程| 五月婷婷丁香色| 中文字幕第80页| 日本少妇高潮喷水视频| 日本久久精品一区二区| 加勒比成人在线| 91九色国产ts另类人妖| 激情在线观看视频| 69久久久久久| 国产免费又粗又猛又爽| 成年人视频在线免费| 欧美日韩第二页| 欧洲黄色一级视频| 国内自拍在线观看| 国产av麻豆mag剧集| 日韩一级性生活片| 精品无码国产一区二区三区av| 青青草影院在线观看| 成人午夜免费剧场| 麻豆md0077饥渴少妇| 天堂av免费看| 欧美久久久久久久久久久久久久| 青青草视频国产| 国产精品久久久久久久乖乖| 国产高清www| 玩弄中年熟妇正在播放| 国产精品无码av在线播放| 久久婷婷五月综合色国产香蕉| 99爱视频在线| 一级黄色香蕉视频| 国产又黄又猛的视频| 久久精品国产99久久99久久久| 日韩 欧美 自拍| 国产美女作爱全过程免费视频| 秋霞无码一区二区| aaa毛片在线观看| 三上悠亚在线一区二区| 国产精品久久久久久久av福利| 久久久久亚洲av无码专区喷水| 日韩在线观看a| 男人亚洲天堂网| 亚洲娇小娇小娇小| 日本一级淫片演员| 国产 日韩 亚洲 欧美| 茄子视频成人免费观看| 国产熟人av一二三区| 天天影视色综合| 日本新janpanese乱熟| 九色在线视频观看| 国产精品欧美激情在线观看| 欧美色图另类小说| 天天爽人人爽夜夜爽| 天堂v在线视频| 国产日韩欧美精品在线观看| 四虎永久在线精品无码视频| 国产美女视频免费看| 久久久国内精品| 久久久久久久片| 欧美日韩理论片| 各处沟厕大尺度偷拍女厕嘘嘘| 亚洲视频第二页|