C114通信網(wǎng)  |  通信人家園

人工智能
2025/1/13 08:40

AI產(chǎn)品分析:AI智能體(AI Agent)

天翼智庫  

 

 

發(fā)展概述:AI Agent歷經(jīng)兩階段蛻變,邁向多領(lǐng)域自主執(zhí)行的廣泛應(yīng)用

AI智能體(AI Agent)是一種能夠自主感知環(huán)境、進行決策并執(zhí)行任務(wù)的智能系統(tǒng)。從早期專注于特定任務(wù)的AI系統(tǒng),到如今能自主執(zhí)行復雜任務(wù)的智能實體,演進歷經(jīng)兩個關(guān)鍵時期:

基于規(guī)則和早期機器學習階段:AI Agent專注于特定領(lǐng)域的任務(wù),能力有限。1997年,IBM的深藍在國際象棋中戰(zhàn)勝世界冠軍,展示基于規(guī)則的AI在特定領(lǐng)域的潛力,但缺乏通用性。2016年,谷歌的AlphaGO通過深度學習和蒙特卡洛樹搜索戰(zhàn)勝圍棋高手,拓寬AI在策略博弈領(lǐng)域的應(yīng)用。

基于大語言模型的快速發(fā)展階段:大語言模型強勢崛起,基于LLM的AI Agent應(yīng)運而生。2018年,谷歌發(fā)布BERT模型開啟大語言模型時代,AI Agent進入快速發(fā)展期。2019年,OpenAI推出GPT系列,尤其是GPT-3和GPT-3.5,大幅提升AI Agent的文本生成和知識儲備能力。2023年,LLaMA、BLOOM等開源大模型降低了行業(yè)門檻,促進技術(shù)生態(tài)的多元化。今年3月GPT-4和AutoGPT的發(fā)布,使AI Agent能夠自主規(guī)劃和執(zhí)行復雜任務(wù),實現(xiàn)了從被動執(zhí)行到主動工作的轉(zhuǎn)變。據(jù)Gartner預(yù)計,Agentic AI是2025年十大技術(shù)趨勢之一,并預(yù)測到2028年,至少有15%的日常工作決策將由Agentic AI自主完成。

功能應(yīng)用:基于LLM的AI Agent的關(guān)鍵功能受限,有待未來突破

基于LLM的AI Agent不僅讓每個人都有增強能力的專屬智能助理,還會改變?nèi)藱C協(xié)同的模式。生成式AI帶來的人機協(xié)同,呈現(xiàn)出三種模式。在智能體模式中,AI的互動性、自主性和適應(yīng)性得到充分發(fā)揮,可以作為獨立行動者自主完成任務(wù),人類則從執(zhí)行者轉(zhuǎn)變?yōu)楸O(jiān)督者和評估者,與嵌入模式的命令執(zhí)行工具和副駕駛模式的合作伙伴有本質(zhì)區(qū)別。

表1 生成式AI帶來的三種人機協(xié)同模式對比

AI Agent的關(guān)鍵功能,如自主思考、規(guī)劃與工具調(diào)用、記憶、多模態(tài)理解,當前均存在一定的局限性。一是自主思考能力有限。當前AI Agent多基于RPA理念,依賴人為設(shè)定的規(guī)則和干預(yù),自主探索能力較弱。二是規(guī)劃與工具調(diào)用能力低。AI Agent在復雜場景下的推理和規(guī)劃能力尚待提高,對于模糊或不完整的指令,其表現(xiàn)可能不穩(wěn)定。三是長期記憶構(gòu)建能力不足。大多數(shù)AI Agent依賴Prompt構(gòu)建短期記憶,而事實性記憶則通過RAG技術(shù)實現(xiàn),但缺乏長效、穩(wěn)固的記憶體系,難以支撐連貫且深入的交互需求。四是多模態(tài)理解能力差。AI Agent主要依賴大語言模型,在圖像、音頻、視頻等多模態(tài)信息理解上能力有限。隨著技術(shù)不斷進步,未來AI Agent有望在這些領(lǐng)域?qū)崿F(xiàn)顯著突破,變得更加智能和自適應(yīng)。

市場發(fā)展:2024年企業(yè)AI設(shè)計模式中,AI Agent異軍突起

據(jù)Menlo Ventures數(shù)據(jù),在企業(yè)AI設(shè)計模式中,AI Agent今年異軍突起,占比從0上升至12%。Agent具備復雜推理能力、能執(zhí)行多步驟任務(wù),有望與企業(yè)應(yīng)用深度結(jié)合,在企業(yè)服務(wù)等各類場景中發(fā)揮巨大價值。

圖1 企業(yè)AI設(shè)計模式采用率變化

2024年以來,全球AI Agent賽道資本市場也愈加活躍,融資數(shù)量超25起,融資金額超665億元1,其中下半年融資數(shù)量是上半年2倍多。隨著AI相關(guān)技術(shù)的快速發(fā)展,未來AI Agent領(lǐng)域有望獲得更多融資,市場發(fā)展前景也更加廣闊,據(jù)Markets and Markets預(yù)測,全球AI Agent市場將從2024年的51億美元增長到2030年的471億美元,年復合增長率達44.8%。

AI Agent已成科技巨頭必爭之地。微軟在Ignite 2024技術(shù)大會宣布建立全球最大的企業(yè)級AI Agent生態(tài)系統(tǒng),已有超過10萬家公司利用Copilot Studio創(chuàng)建或編輯AI Agent。谷歌推出商用AI Agent市場AI Agent Space,上架19款解決方案,并且還在持續(xù)更新中。國內(nèi)科技巨頭也在快速布局AI Agent領(lǐng)域,智譜在11月29日的OpenDay上發(fā)布AutoGLM、AutoGLM-Web、AutoGLMPC三款A(yù)gent產(chǎn)品,字節(jié)、騰訊、百度、阿里等大廠也推出扣子、騰訊元器、文心智能體、千帆AgentBuilder等Agent產(chǎn)品。AI Agent成為“新風口”。

典型應(yīng)用:Agent成為個性化需求和企業(yè)智能化轉(zhuǎn)型的重要工具

隨著AI技術(shù)的發(fā)展,有以下幾個典型Agent產(chǎn)品:

AutoGLM更關(guān)注手機端使用。AutoGLM是智譜科技推出的一款A(yù)I智能體產(chǎn)品,旨在提升用戶的生活和工作效率。一是模擬人類操作,通過文字或語音指令,完成如微信點贊評論、淘寶購物、攜程酒店預(yù)訂、12306購票、美團外賣等多項任務(wù)。二是無需API支持,擺脫特定接口依賴,直接對接圖形用戶界面。三是具備跨App能力,支持抖音、京東、餓了么等主流APP,為用戶在多APP交互場景中提供便利,如可在美團和餓了么比價、在小紅書搜攻略后去攜程訂酒店等。四是自動化任務(wù)執(zhí)行,在真實環(huán)境中執(zhí)行自動化任務(wù),簡化用戶的操作流程。AutoGLM在7款常見手機APP中應(yīng)用測試中表現(xiàn)良好,絕大多數(shù)任務(wù)都能圓滿完成,少數(shù)未完成的任務(wù)也能部分推進。

圖2 AutoGLM在7款常見的安卓APP表現(xiàn)情況

Claude 3.5 Sonnet具備“像人一樣使用電腦”的能力。2024年10月,Anthropic發(fā)布升級版Claude 3.5 Sonnet模型。一是推理能力大幅升級,在研究生水平推理能力GPQA、一般推理能力MMLU、編程能力等方面表現(xiàn)優(yōu)于GPT-4o和Gemini 1.5。二是新增“Computer use”功能,可模擬人類操作電腦,通過API指令,Claude能觀察屏幕、移動光標、點擊按鈕和輸入文本,從而執(zhí)行網(wǎng)站設(shè)計、表格填充等任務(wù),顯著提升AI的自動化能力。三是分步驟拆解規(guī)劃,在模擬人類操作電腦時,Claude將任務(wù)拆解成了若干步驟,并對每一步給出詳細解釋,使用合適的工具去完成規(guī)劃。四是具備自我調(diào)整過程,如遇到瀏覽器閃崩可以再次打開瀏覽器并展示結(jié)果。升級版Claude 3.5 Sonnet在OSWorld2測試中,雖然得分為AI模型中首位,但其電腦使用能力表現(xiàn)較人類水平仍有提升空間。

Agentforce商業(yè)化進展加速。Agentforce是由Salesforce在2024年9月推出的一款自主AI Agent產(chǎn)品,旨在通過智能化和自動化的方式提升企業(yè)的服務(wù)、銷售和營銷效率。Agentforce由Agent Builder和Agentforce Service Agent兩部分組成。一是提供定制服務(wù),Agent Builder可以讓企業(yè)用戶可通過低代碼/無代碼等方式來定制AI Agent,以適應(yīng)不同的業(yè)務(wù)場景需求。二是支持即用服務(wù),Agentforce Service Agent是面向客戶的AI服務(wù)助手,支持多渠道(如語音、WhatsApp、Facebook Messenger)自助服務(wù),幫助企業(yè)快速響應(yīng)客戶需求。Agentforce已面向服務(wù)和銷售全面推出,起價為每對話2美元。根據(jù)Salesforce FY2025Q3業(yè)績會,第三季度公司獲得超過100萬美元的AI交易數(shù)量,同比增長兩倍多。

表2 典型AI agent應(yīng)用對比

注釋

1.數(shù)據(jù)來源:來覓數(shù)據(jù)

2.一項評估 AI 模型電腦使用能力的測試

本文作者

左芳芳

戰(zhàn)略發(fā)展研究所

二級分析師

中級統(tǒng)計師,就職于中國電信研究院,長期從事產(chǎn)業(yè)數(shù)字化、數(shù)據(jù)要素等研究領(lǐng)域。

張秀鳳

戰(zhàn)略發(fā)展研究所

二級分析師

碩士、高級工程師。具有多年通信行業(yè)、零售行業(yè)研究經(jīng)驗。近年來主要從事數(shù)字政府、行業(yè)數(shù)字化轉(zhuǎn)型等領(lǐng)域的研究。

鄧麗華

戰(zhàn)略發(fā)展研究所

一級分析師

就職于中國電信研究院,長期從事價值評估、行業(yè)洞察等,近年來專注產(chǎn)業(yè)數(shù)字化、人工智能等領(lǐng)域研究。

田盼

戰(zhàn)略發(fā)展研究所

副主任分析師

高級工程師,就職于中國電信研究院,長期從事產(chǎn)業(yè)數(shù)字化政策、需求和趨勢研究。

給作者點贊
0 VS 0
寫得不太好

免責聲明:本文僅代表作者個人觀點,與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報電話:021-54451141