半月談?dòng)浾?郭方達(dá)
“具身智能”被認(rèn)為是人工智能競爭的重要領(lǐng)域。2025年的政府工作報(bào)告提出,建立未來產(chǎn)業(yè)投入增長機(jī)制,培育生物制造、量子科技、具身智能、6G等未來產(chǎn)業(yè)。行業(yè)數(shù)據(jù)顯示,2024年全球人形機(jī)器人新品發(fā)布數(shù)量已超過106款,遠(yuǎn)超過去20年的總和,與之相伴的“具身智能”概念成為全世界追捧的熱點(diǎn)。谷歌、特斯拉等一眾國際知名企業(yè)紛紛布局該賽道,波士頓動(dòng)力、宇樹科技等新興企業(yè)的產(chǎn)品更是吸睛無數(shù)。
作為拓展人類能力邊界的“外骨骼”,具身智能的技術(shù)裂變究竟還有多遠(yuǎn)?
人形,不止于人形
“許多人第一次對具身智能有直觀印象,就是看見春晚舞臺(tái)上轉(zhuǎn)手絹的機(jī)器人?!碧旖虼髮W(xué)無人駕駛汽車交叉研究中心主任謝輝表示,人形機(jī)器人是該領(lǐng)域最具“顯示度”的產(chǎn)品,可通過類似人類的身體結(jié)構(gòu),執(zhí)行許多傳統(tǒng)任務(wù)。
事實(shí)上,任何能夠在物理空間中進(jìn)行互動(dòng)的機(jī)器人,都有望成為具身智能的載體,具身智能機(jī)器人的關(guān)鍵在于具身智能的底層技術(shù),而非機(jī)器人的物理形狀?!叭诵螜C(jī)器人是對于當(dāng)前物理環(huán)境的友好解決方案之一,但不會(huì)是針對所有場景的最優(yōu)方案,比如組裝一輛汽車,人形機(jī)器人的效率就很難比機(jī)械臂高?!碧旖蛐滤蓹C(jī)器人自動(dòng)化有限公司總經(jīng)理高松表示,在工廠等結(jié)構(gòu)化場景中,具身智能有很多外形不一的載體。
具身智能依托軟件算法和物理載體,能夠感知環(huán)境、做出決策并執(zhí)行具體的任務(wù)。清華大學(xué)人工智能學(xué)院教授沈陽說,具身智能作為一種軟硬件一體的特殊智能體,依賴的是多模態(tài)模型?!氨热鏥LA大模型,V的視覺,L的語言,A的動(dòng)作,形成一套感知決策行動(dòng)的完整流程。”短期內(nèi),車輛很有可能成為具身智能最先投入大規(guī)模應(yīng)用的領(lǐng)域。“通過傳感器進(jìn)行視覺識(shí)別,大模型與用戶交互,最后落實(shí)在對汽車的機(jī)械操控上。”謝輝說。
從市場來看,全世界都對具身智能領(lǐng)域顯示出濃厚興趣。國際知名投資機(jī)構(gòu)高盛預(yù)測,2035年人形機(jī)器人全球市場規(guī)模將高達(dá)380億美元。我國北京、浙江、廣東等多省市已經(jīng)相繼出臺(tái)具身智能發(fā)展規(guī)劃,力圖打造領(lǐng)先的產(chǎn)業(yè)聚集區(qū)。工業(yè)和信息化部印發(fā)的《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見》,提出到2027年產(chǎn)業(yè)綜合實(shí)力達(dá)到世界先進(jìn)水平、成為重要的經(jīng)濟(jì)增長新引擎等發(fā)展目標(biāo)。
2025年3月21日,北京,中關(guān)村國際創(chuàng)新中心,入口咨詢臺(tái)在布置的具身智能機(jī)器人
具身智能“成人禮”尚未到來
——通用平臺(tái)和標(biāo)準(zhǔn)化認(rèn)證缺乏,多數(shù)企業(yè)陷入“重復(fù)造輪子”。國訊芯微(蘇州)科技有限公司首席技術(shù)官蔣琛表示,目前在具身智能領(lǐng)域,仍舊沒有統(tǒng)一的技術(shù)標(biāo)準(zhǔn)和通用開發(fā)平臺(tái),這就使得多數(shù)企業(yè)都要從0到1獨(dú)立研發(fā),各地重復(fù)投入導(dǎo)致資源分散,影響產(chǎn)出效率。同時(shí),硬件接口、通信協(xié)議、數(shù)據(jù)格式等缺乏統(tǒng)一規(guī)范,不同廠商的機(jī)器人本體構(gòu)型與軟件架構(gòu)互不兼容,制約規(guī)?;瘧?yīng)用。
——應(yīng)用場景開放度不足,缺乏快速孵化條件?!皺C(jī)器人最終還是要用起來?!碧旖蚶首u(yù)機(jī)器人有限公司董事長任志勇表示,研發(fā)端的企業(yè)和應(yīng)用行業(yè)尚未打通,許多實(shí)際工況都未能真正納入研發(fā)測試體系中,許多產(chǎn)品仍停留在“溫室花朵”的階段。高松認(rèn)為,具身智能要真正走入生活,還需要在眾多非結(jié)構(gòu)化場景中積累數(shù)據(jù),與ChatGPT等依賴文本數(shù)據(jù)的大模型不同,具身智能需采集真實(shí)物理環(huán)境的動(dòng)態(tài)交互數(shù)據(jù),其采集成本更為高昂。
——核心元器件自主化程度不足,復(fù)合型人才缺口擴(kuò)大。北京大學(xué)智能學(xué)院副院長林宙辰坦言,在高端GPU、精密傳感器、減速機(jī)等領(lǐng)域,我國企業(yè)的自主化程度依舊有待提高,對本土創(chuàng)新型人才的需求也隨之增加?!坝忠幊蹋忠竽P?,現(xiàn)在還要懂機(jī)械和自動(dòng)化,這樣的人才太少太少?!敝x輝表示,伴隨著多領(lǐng)域的交叉融合,行業(yè)的人才要求從雙棲走向三棲,未來的門檻還將進(jìn)一步提高。
——法律道德風(fēng)險(xiǎn)仍是未解之題。謝輝舉例說,如果一臺(tái)被植入了惡意程序的智能車輛接入網(wǎng)絡(luò)中,可以生成并發(fā)送虛假的緊急消息,誤導(dǎo)周圍車輛的行駛路線、行車速度和前進(jìn)方向等,從而制造交通擁堵與混亂,極端情況下甚至可以主動(dòng)制造交通事故。對于這類智能機(jī)器可能造成損失的情況,責(zé)任歸屬邊界依舊模糊,開發(fā)者、運(yùn)營者等主體責(zé)任幾何?這道“前置題”尚沒有答案。
產(chǎn)業(yè)競速先機(jī)何在
加強(qiáng)底層建設(shè),構(gòu)建龍頭引領(lǐng)共建的行業(yè)生態(tài)。蔣琛等人建議,加強(qiáng)具身智能領(lǐng)域的開放平臺(tái)建設(shè),在底層代碼、數(shù)據(jù)集等環(huán)節(jié)建立開源共享行業(yè)機(jī)制。主管部門宜組織龍頭企業(yè),鼓勵(lì)開發(fā)從硬件到軟件、從底層到應(yīng)用層、從AI模型底座到3D數(shù)據(jù)集的通用開發(fā)套件。盡快制定國家級具身智能發(fā)展規(guī)劃,加快標(biāo)準(zhǔn)建設(shè),創(chuàng)建生態(tài)認(rèn)證體系,推動(dòng)技術(shù)加速迭代。
促進(jìn)應(yīng)用場景開放,提供高質(zhì)量的現(xiàn)實(shí)數(shù)據(jù)。任志勇等人認(rèn)為,具身數(shù)據(jù)無法從互聯(lián)網(wǎng)海量內(nèi)容中直接獲取,而需通過真實(shí)的機(jī)器人操作來采集或高級仿真平臺(tái)生成,因此需要較高的采集成本和廣泛的應(yīng)用場景支持。建議在柔性生產(chǎn)、醫(yī)療康養(yǎng)、公共安全、應(yīng)急救援等領(lǐng)域開放政府、國企主導(dǎo)的應(yīng)用場景,為廣大企業(yè)提供測試平臺(tái)。
強(qiáng)化高校、科研院所、企業(yè)的聯(lián)合科研能力,為技術(shù)創(chuàng)新提供支撐。謝輝認(rèn)為,高校要打破學(xué)科專業(yè)壁壘,對現(xiàn)有學(xué)科專業(yè)體系進(jìn)行調(diào)整升級,重視跨學(xué)科課程建設(shè)和人才培養(yǎng)項(xiàng)目,如推出“人工智能+X”雙學(xué)位項(xiàng)目等,打破傳統(tǒng)學(xué)科專業(yè)界限,培養(yǎng)一批適宜人工智能領(lǐng)域的復(fù)合型人才。
加速建設(shè)前置治理體系,完善法律等安全防線。業(yè)內(nèi)人士認(rèn)為,構(gòu)建責(zé)任明晰的治理框架,是具身智能安全投用的重要保障。一方面應(yīng)在隱私數(shù)據(jù)保護(hù)、責(zé)任歸屬等方面進(jìn)行充分論證并出臺(tái)相關(guān)法律法規(guī),避免監(jiān)管真空;另一方面則應(yīng)建立人工智能領(lǐng)域的預(yù)警及應(yīng)急熔斷機(jī)制,盡可能將風(fēng)險(xiǎn)及影響降至最低。
編輯:尤立