中文字幕亚洲欧美,日本特黄aaaaaaa大片,久草精品在线观看

AI 是否進(jìn)入下半場或許還有爭議，但大模型進(jìn)入淘汰賽已經(jīng)板上釘釘。

在 DeepSeek R1 橫空出世后更是愈演愈烈，今年光是 OpenAI、Anthropic、Google、Meta、Grok 目前已經(jīng)合計(jì)發(fā)了至少 8 款新模型，而國內(nèi)的 AI 六小龍們也有的開始放棄預(yù)訓(xùn)練，將 AGI 的理想主義束之高閣。

在這當(dāng)中，階躍星辰是一家有點(diǎn)特殊的公司。在去年年底之前都鮮有融資消息，但卻在多模態(tài)模型上成為「卷王」，成 2 年已經(jīng)發(fā)布了 22 款研基座模型，成為最低調(diào)神秘的 AI 獨(dú)角獸。

階躍星辰創(chuàng)始人兼 CEO 的姜大昕，和這家公司一樣低調(diào)，很少出現(xiàn)在 AI 行業(yè)熱鬧的輿論場中。

而昨天，姜大昕與 APPSO 等媒體進(jìn)行一場深度的溝通會，他向我們分享對于 AGI 路徑，多模態(tài)模型等技術(shù)的看法，以及階躍星辰未來的計(jì)劃。

多模態(tài)模型還沒出現(xiàn) GPT-4 時刻，追求「智能上限」

當(dāng)下 AI 大模型領(lǐng)域的內(nèi)卷沒有盡頭，頭部公司之間不斷上演著「貼臉發(fā)布」的激烈戲碼。

不過姜大昕依然認(rèn)為，「追求智能的上限依舊是現(xiàn)階段 AI 業(yè)內(nèi)的重點(diǎn)。」也就是說，雖然現(xiàn)在市面上模型一大堆，看起來都挺能打，但離真正的「聰明」還差得遠(yuǎn)。

大家都在搶發(fā)新模型，看著熱鬧，但如果只是在現(xiàn)有水平上修修補(bǔ)補(bǔ)，那也只是原地踏步的「內(nèi)卷」。

姜大昕覺得，現(xiàn)在最要緊的還是得想辦法把 AI 的「智商」往上再拔一拔，不然離大家心心念念的 AGI（通用人工智能）還遠(yuǎn)著呢。

在 DeepSeek R1 面世，以及大廠高調(diào)入場后，不少初創(chuàng)公司開始放棄研發(fā)基礎(chǔ)模型，不過姜大昕在接受 APPSO 采訪時表示：

AI 行業(yè)的技術(shù)發(fā)展非常快，依然處于非常陡峭的區(qū)間。階躍不想在這個過程中放棄主流增長或前進(jìn)的趨勢，所以我們還是會堅(jiān)持做基礎(chǔ)模型的研發(fā)。

同時姜大昕表示，應(yīng)用和模型是相輔相成的，模型可以決定應(yīng)用的上限，應(yīng)用給模型提供具體的應(yīng)用場景和數(shù)據(jù)。

那怎么才能讓 AI 更聰明？姜大昕給出的一個關(guān)鍵路徑是：「多模態(tài)正是實(shí)現(xiàn) AGI 的必經(jīng)之路。」

很多人說今年的 Agent 元年，姜大昕認(rèn)為 Agent 爆發(fā)需要兩個必要的條件，一個是多模態(tài)的能力，另外一個是慢思考的能力。

多模態(tài)，說白了就是讓 AI 不光能看懂文字，還得能看圖、聽聲、理解視頻。

你想想人不就是眼耳口鼻一塊兒上，才能全面理解這個世界嘛。AI 也得這樣，變成一個能聽、能看、能說的「多面手」。

階躍星辰可以說是多模態(tài)模型的「卷王」了，幾乎每個月都發(fā)布一款基礎(chǔ)模型，其中多模態(tài)模型已經(jīng)有 16 款。覆蓋了從圖像、視頻到語音、音樂的理解和生成，用姜大昕的話說，是堅(jiān)持「原生多模理念」。

不過，姜大昕也挺實(shí)在，他坦陳「多模態(tài)模型領(lǐng)域目前還沒有出現(xiàn) GPT-4 時刻。」

雖然多模態(tài)現(xiàn)在挺火，各家都在推，但還沒出那種像 GPT-4 在文字領(lǐng)域那樣，一出來就「哇哦」一下，讓所有人都覺得「就是它了」的標(biāo)桿性產(chǎn)品，技術(shù)上還有不少硬骨頭要啃。

AI 升級打怪三部曲

對于模型如何一步步逼近智能的上限，姜大昕描繪了一幅清晰的「三部曲」演進(jìn)路線圖，也可以說，這是階躍星辰理解的 AGI 演進(jìn)方向。

模擬世界（模仿學(xué)習(xí)階段）：這階段的 AI 就像個剛學(xué)說話的小孩，喂給它海量數(shù)據(jù)，它就吭哧吭哧地學(xué)，主要任務(wù)是「predict next token」（預(yù)測下一個詞）或者「predict next frame」（預(yù)測下一幀畫面）。目的是讓 AI 先學(xué)會這個世界長啥樣，各種東西有啥特征。

探索世界（強(qiáng)化學(xué)習(xí)階段）：光會模仿還不行，還得培養(yǎng)解決復(fù)雜問題的能力。比如解個奧數(shù)題、寫段復(fù)雜的代碼，這需要「慢思考」。這時候就得上強(qiáng)化學(xué)習(xí)了，讓 AI 在不斷試錯中學(xué)會怎么一步步把難題給解開。

歸納世界（機(jī)器自主學(xué)習(xí)階段）：這是最高境界了，AI 不光能解決已知問題，還能自己去發(fā)現(xiàn)新規(guī)律，搞點(diǎn)人類沒想到的創(chuàng)新。比如在科研領(lǐng)域幫科學(xué)家發(fā)現(xiàn)新材料、新藥物啥的。

這三個階段，與 OpenAI 提出的 AGI 五個 Level 在核心理念上不謀而合，現(xiàn)在整個 AI 行業(yè)的發(fā)展，基本就是照著這個劇本在推進(jìn)。

為什么「理解生成一體化」這么重要？

在多模態(tài)，尤其是圖像視頻這塊，姜大昕在溝通會中多次強(qiáng)調(diào)一個詞：理解生成一體化。

理解生成一體化是計(jì)算機(jī)視覺領(lǐng)域的核心問題，對于實(shí)現(xiàn) AGI 至關(guān)重要。

說白了，就是讓模型既能看懂一幅圖、一段視頻是啥意思，又能根據(jù)這個理解自己創(chuàng)作出新的、相關(guān)的圖像視頻。現(xiàn)在很多時候是「看圖用 A 模型，畫圖用 B 模型」，跟倆部門似的，配合不起來。

他舉了個例子，比如老師在黑板上寫字，現(xiàn)在的 Sora 能模仿老師寫字的動作，但老師腦子里想的是啥、接下來要寫什么內(nèi)容，這得靠「理解」。如果理解和生成是兩套系統(tǒng)，那模型就很難真正「懂」你，生成的玩意兒也可能不著邊際。

語言模型像 ChatGPT 在這方面已經(jīng)做得不錯了，但視覺領(lǐng)域因?yàn)閿?shù)據(jù)太復(fù)雜，這事兒還沒完全搞定。階躍星辰在這上面是持續(xù)投入，想把這個技術(shù)瓶頸給突破了。

強(qiáng)大的模型能力最終需要通過應(yīng)用來體現(xiàn)價值。階躍星辰采取的是「超級模型與超級應(yīng)用雙輪驅(qū)動」的策略。

在應(yīng)用層面，階躍星辰將「智能終端 Agent」作為重點(diǎn)發(fā)力方向。姜大昕認(rèn)為，智能終端，無論是我們口袋里的手機(jī)、日常駕駛的汽車，還是未來可能普及的機(jī)器人，它們不僅僅是冰冷的硬件，更是「用戶感知和體驗(yàn)的延伸」。

這意味著，AI 如果能與這些終端深度融合，就能更好地「理解用戶需求和任務(wù)上下文」。

比如， OPPO 旗艦 Find X8 Ultra 正式開售首發(fā)的「一鍵閃記」的功能，AI 可以智能識別手機(jī)屏幕上的內(nèi)容，為用戶生成摘要，并將碎片化的信息歸類到不同的記憶合集。

這背后搭載的其實(shí)就是階躍星辰多模態(tài)模型，它能理解屏幕上顯示的內(nèi)容，無論是圖片還是文字，用戶可以就此提問，AI 不僅能回答，還能進(jìn)行圖片處理，甚至幫助用戶完成一些應(yīng)用內(nèi)的操作，比如直接跳轉(zhuǎn)到機(jī)票預(yù)訂頁面并填好信息。

這種合作，將大模型的能力和系統(tǒng)更深度融合，嵌入到用戶最高頻的手機(jī)使用場景中，選擇手機(jī)作為切入點(diǎn)，其價值在于手機(jī)天然的多模態(tài)交互屬性和龐大的用戶基數(shù)，為模型迭代提供了豐富的真實(shí)數(shù)據(jù)和即時反饋。

總的來說，階躍星辰的思路挺清晰：技術(shù)上瞄準(zhǔn) AGI，死磕多模態(tài)和理解生成一體化這些硬核問題。應(yīng)用上呢，就找準(zhǔn)智能終端這個突破口，跟硬件廠商把場景做深做透。

這條路不好走，但姜大昕和他的團(tuán)隊(duì)看起來挺有決心。畢竟，用 AI 解決真實(shí)世界的問題，先在市場獲得用戶認(rèn)可，才有機(jī)會探索 AGI 的天花板，讓我們看看階躍星辰這個多模態(tài)卷王后面還能拿出什么新東西來。

宙世代元宇宙

元宇宙黨建解決方案

元宇宙文旅解決方案

元宇宙展廳解決方案

元宇宙行業(yè)峰會解決方案

元宇宙營銷解決方案

元宇宙會展解決方案

元宇宙演藝節(jié)目解決方案

元宇宙博物館解決方案

元宇宙圖書館解決方案

元宇宙校園解決方案

元宇宙企業(yè)展廳解決方案

元宇宙藝術(shù)展解決方案

元宇宙電商解決方案

融媒體解決方案

ZAKER智慧云

媒體解決方案

黨建解決方案

公檢法解決方案

智慧交通解決方案

高校解決方案

AI視頻剪輯

AI視頻剪輯

AI智能客服

AI工具箱

AI寫稿助手

AI口語陪練

我的訂閱

對話階躍星辰創(chuàng)始人姜大昕：多模態(tài)模型還沒出現(xiàn) GPT-4 時刻，堅(jiān)持追求「智能上限」

宙世代

一起剪

相關(guān)閱讀

哪吒汽車有錢了？將償還近5000萬元欠款

3199元起！華為智能門鎖2 Pro/Ultra開啟預(yù)售：首次掌靜脈+3D人臉識別

國民嚴(yán)選手機(jī)！魅族Note 16搭載LCD無頻閃護(hù)眼屏：通過泰爾低風(fēng)險舒適度護(hù)眼認(rèn)證

相當(dāng)走心！微軟win11上線新版開始菜單 界面清爽順手

為年輕人而生！榮耀全新系列手表官宣：超好玩的能量小圓表

雷軍逐步恢復(fù)！小米15S Pro或下周發(fā)布：搭載玄戒自研SoC

工信部整頓隱藏式車門把手/雷軍：過去1個月是創(chuàng)業(yè)最艱難時期/東鵬特飲回應(yīng)百度地圖植入廣告

驍龍8至尊版+LCD屏！一加平板2 Pro配置曝光：與一加Ace5至尊版一同發(fā)布

紐北專為小米設(shè)置「小米彎道」；馬斯克 xAI 估值超 1200 億美元；智元辦機(jī)器人比賽獎金 50 萬美元

專訪裕太微車載事業(yè)部總經(jīng)理郝世龍：芯片企業(yè)與車企從“供需”到“共生”

5.8mm最薄驍龍8 Elite旗艦！三星Galaxy S25 edge全配色渲染圖出爐

微短劇行業(yè)的兩大增長極、兩大方向、兩大短板

解讀理想VLA司機(jī)大模型：你不用付費(fèi)的專屬“代駕”

美團(tuán)推出“安心閃購”！行業(yè)首個購物全流程保障體系：華為、小米等已上線

百度：一年為用戶攔截惡意網(wǎng)站805億次

最新評論

愛范兒

熱門推薦

相當(dāng)走心！微軟win11上線新版開始菜單界面清爽順手