2025/1/13 08:40

AI產(chǎn)品分析：AI智能體（AI Agent）

天翼智庫

發(fā)展概述：AI Agent歷經(jīng)兩階段蛻變，邁向多領(lǐng)域自主執(zhí)行的廣泛應(yīng)用

AI智能體（AI Agent）是一種能夠自主感知環(huán)境、進行決策并執(zhí)行任務(wù)的智能系統(tǒng)。從早期專注于特定任務(wù)的AI系統(tǒng)，到如今能自主執(zhí)行復雜任務(wù)的智能實體，演進歷經(jīng)兩個關(guān)鍵時期：

基于規(guī)則和早期機器學習階段：AI Agent專注于特定領(lǐng)域的任務(wù)，能力有限。1997年，IBM的深藍在國際象棋中戰(zhàn)勝世界冠軍，展示基于規(guī)則的AI在特定領(lǐng)域的潛力，但缺乏通用性。2016年，谷歌的AlphaGO通過深度學習和蒙特卡洛樹搜索戰(zhàn)勝圍棋高手，拓寬AI在策略博弈領(lǐng)域的應(yīng)用。

基于大語言模型的快速發(fā)展階段：大語言模型強勢崛起，基于LLM的AI Agent應(yīng)運而生。2018年，谷歌發(fā)布BERT模型開啟大語言模型時代，AI Agent進入快速發(fā)展期。2019年，OpenAI推出GPT系列，尤其是GPT-3和GPT-3.5，大幅提升AI Agent的文本生成和知識儲備能力。2023年，LLaMA、BLOOM等開源大模型降低了行業(yè)門檻，促進技術(shù)生態(tài)的多元化。今年3月GPT-4和AutoGPT的發(fā)布，使AI Agent能夠自主規(guī)劃和執(zhí)行復雜任務(wù)，實現(xiàn)了從被動執(zhí)行到主動工作的轉(zhuǎn)變。據(jù)Gartner預(yù)計，Agentic AI是2025年十大技術(shù)趨勢之一，并預(yù)測到2028年，至少有15%的日常工作決策將由Agentic AI自主完成。

功能應(yīng)用：基于LLM的AI Agent的關(guān)鍵功能受限，有待未來突破

基于LLM的AI Agent不僅讓每個人都有增強能力的專屬智能助理，還會改變?nèi)藱C協(xié)同的模式。生成式AI帶來的人機協(xié)同，呈現(xiàn)出三種模式。在智能體模式中，AI的互動性、自主性和適應(yīng)性得到充分發(fā)揮，可以作為獨立行動者自主完成任務(wù)，人類則從執(zhí)行者轉(zhuǎn)變?yōu)楸O(jiān)督者和評估者，與嵌入模式的命令執(zhí)行工具和副駕駛模式的合作伙伴有本質(zhì)區(qū)別。

表1 生成式AI帶來的三種人機協(xié)同模式對比

AI Agent的關(guān)鍵功能，如自主思考、規(guī)劃與工具調(diào)用、記憶、多模態(tài)理解，當前均存在一定的局限性。一是自主思考能力有限。當前AI Agent多基于RPA理念，依賴人為設(shè)定的規(guī)則和干預(yù)，自主探索能力較弱。二是規(guī)劃與工具調(diào)用能力低。AI Agent在復雜場景下的推理和規(guī)劃能力尚待提高，對于模糊或不完整的指令，其表現(xiàn)可能不穩(wěn)定。三是長期記憶構(gòu)建能力不足。大多數(shù)AI Agent依賴Prompt構(gòu)建短期記憶，而事實性記憶則通過RAG技術(shù)實現(xiàn)，但缺乏長效、穩(wěn)固的記憶體系，難以支撐連貫且深入的交互需求。四是多模態(tài)理解能力差。AI Agent主要依賴大語言模型，在圖像、音頻、視頻等多模態(tài)信息理解上能力有限。隨著技術(shù)不斷進步，未來AI Agent有望在這些領(lǐng)域?qū)崿F(xiàn)顯著突破，變得更加智能和自適應(yīng)。

市場發(fā)展：2024年企業(yè)AI設(shè)計模式中，AI Agent異軍突起

據(jù)Menlo Ventures數(shù)據(jù)，在企業(yè)AI設(shè)計模式中，AI Agent今年異軍突起，占比從0上升至12%。Agent具備復雜推理能力、能執(zhí)行多步驟任務(wù)，有望與企業(yè)應(yīng)用深度結(jié)合，在企業(yè)服務(wù)等各類場景中發(fā)揮巨大價值。

圖1 企業(yè)AI設(shè)計模式采用率變化

2024年以來，全球AI Agent賽道資本市場也愈加活躍，融資數(shù)量超25起，融資金額超665億元1，其中下半年融資數(shù)量是上半年2倍多。隨著AI相關(guān)技術(shù)的快速發(fā)展，未來AI Agent領(lǐng)域有望獲得更多融資，市場發(fā)展前景也更加廣闊，據(jù)Markets and Markets預(yù)測，全球AI Agent市場將從2024年的51億美元增長到2030年的471億美元，年復合增長率達44.8%。

AI Agent已成科技巨頭必爭之地。微軟在Ignite 2024技術(shù)大會宣布建立全球最大的企業(yè)級AI Agent生態(tài)系統(tǒng)，已有超過10萬家公司利用Copilot Studio創(chuàng)建或編輯AI Agent。谷歌推出商用AI Agent市場AI Agent Space，上架19款解決方案，并且還在持續(xù)更新中。國內(nèi)科技巨頭也在快速布局AI Agent領(lǐng)域，智譜在11月29日的OpenDay上發(fā)布AutoGLM、AutoGLM-Web、AutoGLMPC三款A(yù)gent產(chǎn)品，字節(jié)、騰訊、百度、阿里等大廠也推出扣子、騰訊元器、文心智能體、千帆AgentBuilder等Agent產(chǎn)品。AI Agent成為“新風口”。

典型應(yīng)用：Agent成為個性化需求和企業(yè)智能化轉(zhuǎn)型的重要工具

隨著AI技術(shù)的發(fā)展，有以下幾個典型Agent產(chǎn)品：

AutoGLM更關(guān)注手機端使用。AutoGLM是智譜科技推出的一款A(yù)I智能體產(chǎn)品，旨在提升用戶的生活和工作效率。一是模擬人類操作，通過文字或語音指令，完成如微信點贊評論、淘寶購物、攜程酒店預(yù)訂、12306購票、美團外賣等多項任務(wù)。二是無需API支持，擺脫特定接口依賴，直接對接圖形用戶界面。三是具備跨App能力，支持抖音、京東、餓了么等主流APP，為用戶在多APP交互場景中提供便利，如可在美團和餓了么比價、在小紅書搜攻略后去攜程訂酒店等。四是自動化任務(wù)執(zhí)行，在真實環(huán)境中執(zhí)行自動化任務(wù)，簡化用戶的操作流程。AutoGLM在7款常見手機APP中應(yīng)用測試中表現(xiàn)良好，絕大多數(shù)任務(wù)都能圓滿完成，少數(shù)未完成的任務(wù)也能部分推進。

圖2 AutoGLM在7款常見的安卓APP表現(xiàn)情況

Claude 3.5 Sonnet具備“像人一樣使用電腦”的能力。2024年10月，Anthropic發(fā)布升級版Claude 3.5 Sonnet模型。一是推理能力大幅升級，在研究生水平推理能力GPQA、一般推理能力MMLU、編程能力等方面表現(xiàn)優(yōu)于GPT-4o和Gemini 1.5。二是新增“Computer use”功能，可模擬人類操作電腦，通過API指令，Claude能觀察屏幕、移動光標、點擊按鈕和輸入文本，從而執(zhí)行網(wǎng)站設(shè)計、表格填充等任務(wù)，顯著提升AI的自動化能力。三是分步驟拆解規(guī)劃，在模擬人類操作電腦時，Claude將任務(wù)拆解成了若干步驟，并對每一步給出詳細解釋，使用合適的工具去完成規(guī)劃。四是具備自我調(diào)整過程，如遇到瀏覽器閃崩可以再次打開瀏覽器并展示結(jié)果。升級版Claude 3.5 Sonnet在OSWorld2測試中，雖然得分為AI模型中首位，但其電腦使用能力表現(xiàn)較人類水平仍有提升空間。

Agentforce商業(yè)化進展加速。Agentforce是由Salesforce在2024年9月推出的一款自主AI Agent產(chǎn)品，旨在通過智能化和自動化的方式提升企業(yè)的服務(wù)、銷售和營銷效率。Agentforce由Agent Builder和Agentforce Service Agent兩部分組成。一是提供定制服務(wù)，Agent Builder可以讓企業(yè)用戶可通過低代碼/無代碼等方式來定制AI Agent，以適應(yīng)不同的業(yè)務(wù)場景需求。二是支持即用服務(wù)，Agentforce Service Agent是面向客戶的AI服務(wù)助手，支持多渠道（如語音、WhatsApp、Facebook Messenger）自助服務(wù)，幫助企業(yè)快速響應(yīng)客戶需求。Agentforce已面向服務(wù)和銷售全面推出，起價為每對話2美元。根據(jù)Salesforce FY2025Q3業(yè)績會，第三季度公司獲得超過100萬美元的AI交易數(shù)量，同比增長兩倍多。

表2 典型AI agent應(yīng)用對比

注釋

1.數(shù)據(jù)來源:來覓數(shù)據(jù)

2.一項評估 AI 模型電腦使用能力的測試

本文作者

左芳芳

戰(zhàn)略發(fā)展研究所

二級分析師

中級統(tǒng)計師，就職于中國電信研究院，長期從事產(chǎn)業(yè)數(shù)字化、數(shù)據(jù)要素等研究領(lǐng)域。

張秀鳳

戰(zhàn)略發(fā)展研究所

二級分析師

碩士、高級工程師。具有多年通信行業(yè)、零售行業(yè)研究經(jīng)驗。近年來主要從事數(shù)字政府、行業(yè)數(shù)字化轉(zhuǎn)型等領(lǐng)域的研究。

鄧麗華

戰(zhàn)略發(fā)展研究所

一級分析師

就職于中國電信研究院，長期從事價值評估、行業(yè)洞察等，近年來專注產(chǎn)業(yè)數(shù)字化、人工智能等領(lǐng)域研究。

田盼

戰(zhàn)略發(fā)展研究所

副主任分析師

高級工程師，就職于中國電信研究院，長期從事產(chǎn)業(yè)數(shù)字化政策、需求和趨勢研究。

給作者點贊

0 VS 0

寫得不太好

免責聲明：本文僅代表作者個人觀點，與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實，對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考，并請自行核實相關(guān)內(nèi)容。

相關(guān)鏈接

測試 IBM 微軟百度轉(zhuǎn)型

谷歌 AI 原則生變：刪除“不用于武器”的承諾
IT之家遠洋10:32
AI 業(yè)績亮眼，谷歌母公司 Alphabet 今年資本支出飆升至 750 億美元
IT之家遠洋10:32
谷歌母公司總裁：美國AI難保證對華領(lǐng)先，有些方面甚至落后
鳳凰網(wǎng)科技蕭雨1-22
攪動推理 AI 模型風云：谷歌被曝 1 月 23 日發(fā)布增強版 Gemini 2.0 Flash Thinking
IT之家故淵1-21