67194手机在线看 localhost,欧美一区二区自偷自拍视频,91在线精品播放

當(dāng)前位置:首頁 > 今日頭條 >

00后上場!MetaGPT團(tuán)隊(duì)親述3小時(shí)復(fù)刻Manus歷程,AI智能體風(fēng)

發(fā)布時(shí)間:2025-03-10 22:32:28  |  來源:證券之星  |  閱讀量:7641  |  

圖源:視覺中國

“開源永存。”這是MetaGPT研究員、OpenManus合作者向勁宇在面向時(shí)代財(cái)經(jīng)等的分享中,留下的結(jié)束語。

近一周來,全球首款通用AI智能體——Manus爆火,成為科技圈持續(xù)熱議的話題。

與此同時(shí),Manus的開源替代方案如雨后春筍般冒出。國內(nèi)初創(chuàng)公司DeepWisdom的MetaGPT團(tuán)隊(duì),僅用3小時(shí)便利用開源框架復(fù)刻出OpenManus;開源社區(qū)CAMEL-AI團(tuán)隊(duì)也“0天”復(fù)刻出Manus通用智能體OWL……持續(xù)涌現(xiàn)的復(fù)刻浪潮似乎也向外界傳遞了一個(gè)信息:Agent的門檻并非高不可攀。

Manus的“護(hù)城河”究竟有多深?Agent賽道的終極競爭力是什么?當(dāng)業(yè)內(nèi)普遍認(rèn)為“2025年有望成為AI Agent爆發(fā)元年”時(shí),這個(gè)賽道還有哪些待解難題?

近日,OpenManus核心作者向時(shí)代財(cái)經(jīng)等分享了其中的故事,并給出了他們對于Agent的理解。

3小時(shí)復(fù)刻Manus團(tuán)隊(duì):00后挑大梁

Manus發(fā)布當(dāng)晚,向勁宇感受到身邊的人都很興奮,“大多數(shù)人的興奮似乎來自于AI能使用電腦了。”

但在他看來,這樣的功能在業(yè)內(nèi)認(rèn)識里并不是特別稀奇。

“比如Planning的能力在我們2024年的開源工作Data Interpreter(數(shù)據(jù)解釋器)工作中已經(jīng)有了相關(guān)的實(shí)現(xiàn);而Computer Use和Browser Use等功能也在OpenHands(之前被稱為OpenDevin,一個(gè)由AI提供支持的軟件開發(fā)代理平臺(tái))以及智譜AutoGLM等各個(gè)工作中均有實(shí)現(xiàn)。”向勁宇說。

他判斷,僅從一個(gè)demo級別的實(shí)現(xiàn)來說,“搓”一個(gè)Manus開源版本給大家用“應(yīng)該不是很難”。

MetaGPT研究員、OpenManus核心作者梁新兵迅速響應(yīng),并在第二天一早根據(jù)彼時(shí)已知信息對Manus做了一次完整調(diào)研,包括技術(shù)細(xì)節(jié)和分析。當(dāng)天晚上下班后,向勁宇召集團(tuán)隊(duì)(向勁宇、梁新兵、張佳釔、于兆洋、洪思睿)討論了Manus的產(chǎn)品形態(tài)和技術(shù)路線,決定加班趕出開源版本。

僅用了3小時(shí)左右,“大概11點(diǎn)的時(shí)候,我們就把第一個(gè)版本合并開出去,然后掛到GitHub上面了。”向勁宇回憶。

發(fā)布不到1天,該項(xiàng)目已在GitHub上收獲了7000多顆星星。“當(dāng)時(shí)沒想過OpenManus會(huì)爆火。”梁新兵說。

作為OpenManus核心作者,梁新兵研究生畢業(yè)于華東師范大學(xué),之前曾參與爆火的AI Agent數(shù)據(jù)科學(xué)家Data Interpreter的開發(fā)工作。而向勁宇本科就讀于西南交通大學(xué)應(yīng)用物理系,去年,讀大四的他和隊(duì)友一起使用GPT-4與Claude 3組成多智能體的方案,讓AI分飾多個(gè)角色、相互驗(yàn)證來完成答題步驟,獲得了阿里巴巴數(shù)學(xué)競賽AI賽道全球第二名。二人均是00后,同時(shí)在2024年7月加入MetaGPT團(tuán)隊(duì)。

直到現(xiàn)在,MetaGPT團(tuán)隊(duì)還對OpenManus引發(fā)的大量討論,感到恍惚。

Manus是一款基于AI核心模型所開發(fā)的AI Agent。所謂AI Agent,其往往需要以大語言模型作為核心,并疊加規(guī)劃(Planning)、記憶(Memory)、工具調(diào)用(Tools),從而通過解決任務(wù)邏輯連貫性的問題完成特定的跨系統(tǒng)任務(wù)。

據(jù)MetaGPT團(tuán)隊(duì)解構(gòu)分析Manus來看,Manus是一個(gè)多智能體系統(tǒng),它首先使用Planning Tool做規(guī)劃,形成一個(gè)包含多個(gè)任務(wù)的線性結(jié)構(gòu)的計(jì)劃,然后順序執(zhí)行每一個(gè)任務(wù),并動(dòng)態(tài)分配給相應(yīng)的Agent。Agent在執(zhí)行每個(gè)任務(wù)的過程中,以ReAct循環(huán)的形式調(diào)用工具以完成每一個(gè)任務(wù)。

3小時(shí)便復(fù)刻了Manus,MetaGPT團(tuán)隊(duì)是怎么做到的?

向勁宇認(rèn)為:“一個(gè)極簡的Agent框架,應(yīng)該是可插拔的Tools和Prompt(提示詞)的組合,之后我們沿著這個(gè)思路,寫了一個(gè)完整的Agent迷你框架。”

據(jù)他介紹,決定一個(gè)ReAct Agent效果的關(guān)鍵是提示詞引導(dǎo)和工具使用。在OpenManus中,Prompt控制了Agent整體的行為邏輯,Tools給定了Agent的行動(dòng)空間,二者被定義就能完整詮釋一個(gè)ReAct Agent。

“可插拔的優(yōu)點(diǎn)是可組合,我可以把幾個(gè)不同場景下的Tools組合到一起來創(chuàng)造一個(gè)新的Agent,定義也很方便,不需要單獨(dú)寫內(nèi)部邏輯,只需要修改動(dòng)作空間。”向勁宇進(jìn)一步解釋。

在他看來,“我們的工作是把抽象做得更干凈。提供豐富的工具集合,支持多種Agent通過裝備工具集來靈活擴(kuò)展在不同場景下的能力。”

這其中,規(guī)劃能力很重要。因此,OpenManus繼承了Manus的規(guī)劃優(yōu)勢,通過Planning Tool實(shí)現(xiàn)任務(wù)分解,可以處理現(xiàn)實(shí)世界中的復(fù)雜問題。

MetaGPT團(tuán)隊(duì)分享的OpenManus工作流程

談及OpenManus后續(xù)工作,梁新兵表示,接下來將從增強(qiáng)Planning能力、引入標(biāo)準(zhǔn)化評測、拓展模型適配、實(shí)現(xiàn)容器化部署等諸多方面來提升OpenManus的效果。

OpenManus是否能超越Manus?

“Manus產(chǎn)品交互做得挺好的,有很多技術(shù)也值得學(xué)習(xí)。目前OpenManus效果還很有限,我們還沒有單獨(dú)調(diào)效果。OpenManus前期目標(biāo)打算達(dá)到原始Manus的相同效果,后續(xù)會(huì)依靠龐大的開源社區(qū)不斷優(yōu)化。”梁新兵希望,這些優(yōu)化能給OpenManus帶來更高的智能涌現(xiàn)。

Manus的“護(hù)城河”有多深?

據(jù)Manus官方網(wǎng)站介紹,Manus能一鍵幫用戶做旅行規(guī)劃、股票分析、做PPT、財(cái)報(bào)分析等工作,涵蓋研究、生活、數(shù)據(jù)分析、教育、生產(chǎn)效率等多個(gè)領(lǐng)域。

在官方放出來的視頻中,Manus的表現(xiàn)也令人驚艷,能完全自主地完成從規(guī)劃到執(zhí)行的全流程。例如,在特斯拉股票分析任務(wù)中,Manus能在45秒內(nèi)完成“數(shù)據(jù)抓取建模報(bào)告生成”的全鏈路操作。

簡單而言,用戶只需要輸入簡單的提示指令,一段時(shí)間之后,便可以得到一個(gè)完整的成品交付。

但MetaGPT團(tuán)隊(duì)僅用5人3小時(shí),便通過開源框架復(fù)刻出OpenManus;開源社區(qū)CAMEL-AI團(tuán)隊(duì)也實(shí)現(xiàn)“0天復(fù)刻”,推出OWL并直接開源部分模塊。這些都讓“Manus缺乏技術(shù)壁壘”的質(zhì)疑聲不斷。

據(jù)此前媒體報(bào)道,Manus的模型能力來自Anthropic的Claude。3月10日,Manus創(chuàng)始人季逸超在社交平臺(tái)透露,Manus產(chǎn)品使用了不同的基于阿里千問大模型的微調(diào)模型。

有市場人士認(rèn)為,隨著大模型能力的持續(xù)增強(qiáng),大模型會(huì)逐步將更多工具鏈的功能內(nèi)化。未來大模型便能獨(dú)立實(shí)現(xiàn)Manus期望達(dá)成的效果,而無需再繁瑣地調(diào)用外部工具鏈。因此Manus耗費(fèi)大量精力所創(chuàng)造的價(jià)值,大概率會(huì)被大模型的內(nèi)生能力的增長所淹沒。

一名AI領(lǐng)域的投資人士林亞秋也向時(shí)代財(cái)經(jīng)表達(dá)了類似的觀點(diǎn),“當(dāng)大模型能力變強(qiáng),未來一些高頻場景,有可能模型本身就能覆蓋,大模型公司可能也會(huì)內(nèi)置這些Agent。”

Agent誕生的必要前提是基座模型的性能提升,這是行業(yè)內(nèi)的共識,但為什么率先獲得注意力的會(huì)是Manus?

“Manus能最先跑出來,一方面是因?yàn)閺慕衲甏汗?jié)前后開始,推理模型的技術(shù)取得了比較大的進(jìn)展,這件事對Manus有非常大的幫助,因?yàn)橹挥性谕评砟P统墒斓那闆r下才有機(jī)會(huì)做。”林亞秋向時(shí)代財(cái)經(jīng)表示,“Agent有規(guī)劃、工具調(diào)用和記憶這三個(gè)特點(diǎn),每一點(diǎn)上的成功率都會(huì)影響它最終的成功率。而推理模型變強(qiáng)會(huì)令第一步也是最重要的一步——規(guī)劃能力提升。”

另一方面,Manus創(chuàng)作團(tuán)隊(duì)本身也具備一定的實(shí)力。“他們的產(chǎn)品能力非常強(qiáng),非常懂用戶的需求,且在功能實(shí)現(xiàn)上做得很好。”林亞秋說。據(jù)她了解,Manus創(chuàng)作團(tuán)隊(duì)在之前的兩年里一直在“產(chǎn)品能力”上表現(xiàn)得很好,這是他們團(tuán)隊(duì)擅長的事情。

實(shí)際上,就算3小時(shí)實(shí)現(xiàn)復(fù)刻Manus的MetaGPT團(tuán)隊(duì),也是基于MetaGPT在AI場景的自動(dòng)化和智能體框架上多年的技術(shù)積累。

“從技術(shù)方案上來說,Manus使用了大量有業(yè)內(nèi)共識的核心基礎(chǔ)技術(shù)。但Manus本身是很好的作品,它在用戶示例中展示了卓越的用戶體驗(yàn),以及很不錯(cuò)的整體交互效果。他們團(tuán)隊(duì)實(shí)現(xiàn)了復(fù)雜的規(guī)劃,包括他們自己進(jìn)行過Post Train的模型,提供了更好的效果和交互,也給我們提供了很多發(fā)展思路。”MetaGPT團(tuán)隊(duì)表示。

正如Manus團(tuán)隊(duì)的核心理念“Less structure, more inteligence”,強(qiáng)調(diào)給予AI更多自主權(quán)以決定如何使用工具和完成任務(wù),這種理念也體現(xiàn)在Manus的產(chǎn)品特性上,讓用戶體驗(yàn)更為出色。

事實(shí)上,Manus團(tuán)隊(duì)已聲明,當(dāng)前的Manus距離正式版想交付給大家的體驗(yàn)還差很遠(yuǎn)。“像模型幻覺、交付物友好度、運(yùn)行速度等方面都還有很大的提升空間。”

Manus AI團(tuán)隊(duì)產(chǎn)品負(fù)責(zé)人張濤,同時(shí)也是Monica.im產(chǎn)品合伙人,近日在朋友圈發(fā)文表示,過去的十幾個(gè)小時(shí)對于團(tuán)隊(duì)來說無異于一場充滿各種意外的冒險(xiǎn),團(tuán)隊(duì)低估了大家的熱情。這本是一個(gè)產(chǎn)品探索過程中的階段性收獲分享,因此服務(wù)器資源是對標(biāo)demo水平來準(zhǔn)備,不曾想過會(huì)引起巨大波瀾。

Agent元年,成本與技術(shù)難題仍待解

“2025年有望成為AI Agent元年”似乎已經(jīng)是行業(yè)內(nèi)的一個(gè)共識。

開源證券指出,隨著大模型性能提升與成本的降低,以及能夠在消費(fèi)級顯卡部署帶來的門檻降低,為AI大規(guī)模應(yīng)用落地打下了堅(jiān)實(shí)基礎(chǔ)。Manus的發(fā)布有望加快AI Agent落地,重塑各行業(yè)工作流程。

華泰證券亦指出,Manus AI底層由多模型驅(qū)動(dòng),通過高效的工程化編排,有效滿足了Agent交互過程中的規(guī)劃、自主、準(zhǔn)確三大核心需求,標(biāo)志著Agent應(yīng)用實(shí)現(xiàn)Action環(huán)節(jié)的關(guān)鍵突破。Agent應(yīng)用已進(jìn)入工程化落地關(guān)鍵階段,有望在2025年進(jìn)入放量元年。

Manus等AI Agent的誕生依賴于人們在基座模型上的不斷投入和不斷進(jìn)化。但還有一個(gè)事實(shí)是,“隨著大模型能力的增加,許多問題的解決成功率會(huì)提高,但問題本身并不會(huì)消失。”MetaGPT研究員、OpenManus合作者之一的洪思睿指出。

“人類社會(huì)有很多非常復(fù)雜和長尾的問題,包括我們正在解決的機(jī)器學(xué)習(xí)、代碼修復(fù),以及通過搜索組合結(jié)果提供給用戶的問題。這些仍需要大量技術(shù)工作來提升大模型的效果,包括解決幻覺問題。”洪思睿補(bǔ)充道。

一方面,大模型幻覺依然困擾著AI落地。另一方面,業(yè)內(nèi)目前在規(guī)劃、記憶、工具調(diào)用上仍存在一些難點(diǎn)有待解決。

目前Agent在規(guī)劃方面的進(jìn)步,主要取決于模型本身能力的提升,另外也依靠外部結(jié)構(gòu)的輔助,即在Agent的層面上加入更加復(fù)雜的結(jié)構(gòu)進(jìn)行輔助規(guī)劃。

在工具上,如OpenManus目前主要還是使用一些現(xiàn)有的開源工具,“比如Claude Computer和Browser等。”有其他團(tuán)隊(duì)開展的Browser使用相關(guān)工作表明,僅憑這兩個(gè)工具基本上就能完成許多任務(wù),已經(jīng)初步形成了Manus的雛形。而據(jù)MetaGPT團(tuán)隊(duì)設(shè)想,未來可能增加一種賦予Agent自己創(chuàng)建工具的能力。

不過,在洪思睿看來,大模型或者Agent使用工具本身并不新奇。“但是隨著工具的數(shù)量逐步增加,其中的技術(shù)難點(diǎn)也隨之而來:如果有眾多相似工具,Agent在解決同一任務(wù)時(shí)如何做出準(zhǔn)確決策,選擇最合適的工具;以及工具的參數(shù)定義不合理或不夠明確時(shí),導(dǎo)致大模型在生成調(diào)用工具決策出錯(cuò)等等。這些都是工具使用環(huán)節(jié)中需要解決的問題。”

此外,在記憶環(huán)節(jié)上,MetaGPT團(tuán)隊(duì)認(rèn)為,目前Agent在處理復(fù)雜、長程任務(wù)(例如瀏覽網(wǎng)頁時(shí),網(wǎng)頁信息可能非常長)時(shí),如何壓縮上下文并存儲(chǔ)到記憶中,是一個(gè)非常具有挑戰(zhàn)性的問題,并且要確保壓縮后關(guān)鍵的信息不會(huì)被修改或遺漏。

Memory和推理效率、成本直接相關(guān)。“如果我們不考慮Memory,不做壓縮和任何處理,目前的大模型仍然可以處理,但這樣帶來的問題并非質(zhì)量下降,而是會(huì)顯著增加處理時(shí)間和成本,嚴(yán)重影響用戶體驗(yàn)。”梁新兵說。

如何降本增效,是大量的應(yīng)用廠商首要考慮的問題,也是需要持續(xù)優(yōu)化的方向。

據(jù)Manus團(tuán)隊(duì)此前透露,目前Manus單任務(wù)成本2美元,已經(jīng)做了大量優(yōu)化,但可能對很多用戶來說還是會(huì)難接受。“對于商用來說,還是挺貴的。如果沒有足夠的群眾基礎(chǔ)以及轉(zhuǎn)化率,可能商業(yè)化上就不一定會(huì)特別成功。”林亞秋向時(shí)代財(cái)經(jīng)表示。

當(dāng)一個(gè)Agent產(chǎn)品推出后,開源社區(qū)很快涌現(xiàn)出功能相近的復(fù)刻項(xiàng)目,這引發(fā)了行業(yè)對Agent領(lǐng)域核心競爭力的深度思考:該賽道的終極競爭壁壘究竟何在?

在洪思睿看來,Agent商業(yè)化的重要比拼在于將真實(shí)場景中的任務(wù)和效果,包括個(gè)性化的功能,做到極致。

“目前學(xué)術(shù)界的許多工作,無論是針對SWEBench、GAIA,還是其他的Agent測試,任務(wù)成功率依然有限。如果這種相對微小的任務(wù)標(biāo)準(zhǔn)對應(yīng)到真實(shí)的商業(yè)場景中,不同用戶面對不同難度的問題,目前Agent的成功率還相當(dāng)受限。”

因此,她認(rèn)為,“無論是編程任務(wù),還是數(shù)據(jù)收集和報(bào)告生成任務(wù),如果能夠針對各種各樣的用戶問題和場景做到極致,將成功率提升到令人滿意的程度,真正實(shí)現(xiàn)Agent達(dá)到人們當(dāng)前所期望的行動(dòng)能力,用戶才會(huì)持續(xù)使用Agent。”

同時(shí),展望Agent的未來,洪思睿認(rèn)為,“在真正有效解決用戶實(shí)際需求方面,多智能體的商業(yè)前景是明確且強(qiáng)烈的”,例如從代碼生成——這個(gè)Agent技術(shù)目前能較好解決的場景來看,“目前用戶在這方面的付費(fèi)意愿也是較高的。”

談及Manus的爆火對于行業(yè)帶來的信心,林亞秋說,“Manus獲得巨大關(guān)注,很大程度上加速了對大眾的科普:AI Agent未來可以做很多繁瑣的事務(wù);同時(shí)吸引了很多潛在用戶群。但從投資人和創(chuàng)業(yè)者的角度來看,早在2023年左右大家就認(rèn)為Agent一定是就大語言模型之下能產(chǎn)生的非常重要的應(yīng)用方向。現(xiàn)在大家信心提升的一個(gè)重要原因在于模型進(jìn)步的速度,接下來會(huì)在Agent技術(shù)、產(chǎn)品化方面做探索。”

據(jù)她了解,市場上有很多團(tuán)隊(duì)在推理模型成功提升能力之后,正在快速做產(chǎn)品化。“估計(jì)今年還會(huì)有更多的類似的一些產(chǎn)品出現(xiàn)。”


上一條:“只有一朵玫瑰支撐”,也要溫柔地對待生活
下一條:返回列表

聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多企業(yè)信息之目的,不代表本網(wǎng)觀點(diǎn),亦不代表本網(wǎng)站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。投資有風(fēng)險(xiǎn),需謹(jǐn)慎。

          主站蜘蛛池模板: 谢通门县| 樟树市| 珲春市| 启东市| 平顺县| 江北区| 张北县| 青田县| 泗洪县| 永和县| 武鸣县| 曲阜市| 松阳县| 丰都县| 酉阳| 图们市| 海南省| 清涧县| 永济市| 东乌珠穆沁旗| 鱼台县| 新郑市| 元谋县| 毕节市| 乐清市| 磐石市| 灵丘县| 札达县| 资兴市| 滨海县| 棋牌| 田东县| 柏乡县| 高安市| 花垣县| 乡城县| 玉溪市| 罗江县| 阜康市| 工布江达县| 军事|