亚洲抽日日,日韩精品偷拍一区,97视频久久,又粗又长人妻,一级久久一本成人片,日韩av在线一级,精品欧美第一区,美女白浆A片,91啪国自产

當(dāng)前位置: 首頁 > 廠商資訊 > 正文

座艙終局是對話式智能體 —— 佘士東分享長城AIUI研發(fā)實(shí)踐

2026-04-12 19:39:38

  2026年4月,在2026智能電動(dòng)汽車發(fā)展高層論壇上,長城汽車智能化產(chǎn)品副總經(jīng)理 佘士東出席論壇并發(fā)表主題演講,以下為演講全文。

座艙終局是對話式智能體 —— 佘士東分享長城AIUI研發(fā)實(shí)踐

  大家上午好!長城今年是第36年,整個(gè)汽車行業(yè)年輕化趨勢非常大,估計(jì)在場的應(yīng)該有很多都沒有長城汽車的年齡大。

  我們今天雖然是一個(gè)年齡很大的車廠,但是在整個(gè)AI領(lǐng)域,也是有一些自己的實(shí)踐和思考。今天借這個(gè)機(jī)會,跟大家做一個(gè)分享。

  我今天分享的主題是“AIUI:‘人-智-體’座艙智能體交互新范式”。

  最近這兩年,2024、2025年的車展上陸續(xù)都能看到座艙是高度同質(zhì)化的,上了車之后,基本上是一個(gè)3D的車,壁紙桌面、導(dǎo)航和智駕分層的桌面都是高度同質(zhì)化的,Dock欄也放在同樣的位置,也有非常豐富的APP生態(tài),高度同質(zhì)化。我們把市面上能采集到的200多款不同的交互界面喂大模型之后,大模型給出的結(jié)論“相似度95%以上”,其實(shí)已經(jīng)進(jìn)入了一個(gè)非常痛苦的局面。車廠在做新東西的時(shí)候發(fā)現(xiàn)無米下鍋,已經(jīng)進(jìn)入這樣一個(gè)狀態(tài)。

  但是我們又看到一個(gè)機(jī)會,這個(gè)機(jī)會也開始陸續(xù)大模型上車,大家也在探索一些從原來的人機(jī)交互的時(shí)代向新的面向于人服務(wù)的時(shí)代,產(chǎn)生了一個(gè)巨大的機(jī)會變化,也看到了很多有突破性的特別有創(chuàng)意的一些點(diǎn)子。

  大模型逐漸深入應(yīng)用。從最早2022、2023年,我們也把大模型引入到車?yán)?,其?shí)那個(gè)時(shí)候大家都知道,讓大模型聊天、回答問題,包括DeepSeek上車,我們稱之為后置式大模型的生成內(nèi)容,無論是生成壁紙、路徑規(guī)劃,都是非常初級的階段。今年上半年,包括去年的下半年開始出現(xiàn)了所謂的智能體的語音,也就是可以開始做更廣義的用戶意圖理解,包括上下文場景的理解,還有所謂記憶的引入,開始有了語音智能體,能更好地理解你想做什么。再往后我們也看到了一些自然對話伴隨的智能體,無論是特斯拉在北美的Grok,以及今年春晚爭搶比較嚴(yán)重的,在搶奪所謂大模型新的路口,我們在車上也看到了類似這樣的趨勢,也在判斷車上將來會不會大模型的語音化作為新的入口。再往后更多會有一些主動(dòng)服務(wù)的產(chǎn)品。這是整個(gè)行業(yè)大概的趨勢。

  這個(gè)過程中,跟行業(yè)里交流時(shí)發(fā)現(xiàn)一個(gè)核心的趨勢變化,從原來的人-機(jī)交互,人去使用車上的這些功能,車給你反饋各種各樣的信息,到人智體這樣一個(gè)三方服務(wù)的過程。其實(shí)原來人機(jī)交互的時(shí)代,也不是沒有做,大家都聽過車上有冰箱、彩電、大沙發(fā),但是可能很多人去思考為什么車上的非司機(jī)類的服務(wù)變得越來越多,大家開始越來越多地關(guān)注副駕屏,關(guān)注后排的舒適性,關(guān)注后排的娛樂性,這也是整個(gè)車從原來的司機(jī)跟車之間的人機(jī)交互逐漸演變?yōu)槌丝腿藛T跟車之間的交互,這個(gè)其實(shí)在整個(gè)行業(yè)里我們發(fā)現(xiàn)它已經(jīng)走了三年,從2023到2026年,基本上行業(yè)里邊大概是走這樣一個(gè)過程,市面上會越來越多地看到大六座的車型,包括冰箱、彩電、大沙發(fā),越來越多的豪華性的配置上車,其實(shí)整體來看基本上還處于一個(gè)人機(jī)交互的時(shí)代。我們看到這樣一個(gè)趨勢,就是整個(gè)智能體接入之后,在座各位電腦上很多都已經(jīng)裝到了不同形態(tài)的龍蝦,車載領(lǐng)域也會有這樣一個(gè)產(chǎn)品形態(tài)出現(xiàn),所謂“人-智-體”三方的關(guān)系。一旦車上開始介入了智能體作為中間的一個(gè)中介,它就能實(shí)現(xiàn)這樣一個(gè)體驗(yàn),我們識別到可能重點(diǎn)是兩個(gè),當(dāng)然長城汽車在這一點(diǎn)上已經(jīng)做了很多工程落地,包括具體車型的開發(fā),已經(jīng)不是一個(gè)理念層的發(fā)現(xiàn),而是實(shí)戰(zhàn)上確實(shí)通過人-智-體這樣一個(gè)三方的服務(wù),帶來一些具體體驗(yàn)的提升。

  整個(gè)“人-智-體”服務(wù)的關(guān)系,從原來的人-機(jī)分成了人和智能體,當(dāng)然這個(gè)體更多的車上就是指車控以及生態(tài),還有用戶可能希望通過聊天等獲取一些服務(wù),這是三方的關(guān)系。我們又看到人跟智之間核心的關(guān)系也產(chǎn)生了一些變化,從原來的人去適應(yīng)屏幕上的這些功能按鍵,點(diǎn)擊這些物理按鍵,操作這些功能,甚至現(xiàn)在市面上大多數(shù)的語音仍然是人機(jī)交互系統(tǒng),我們在操作一個(gè)功能的時(shí)候也會非常直白地腦子里去想我要打開空調(diào),我要打開二排右側(cè)座椅的按摩功能,它仍然是一個(gè)人在學(xué)習(xí)機(jī)器的過程。自然對話的服務(wù)產(chǎn)生的變化是人會回歸到陳述一個(gè)自己的感受,陳述一個(gè)事實(shí)或者直接說自己的意圖。簡單來說他想打開空調(diào)不會說“打開空調(diào)”,可能直接說“我冷了”,或者是“我的孩子有點(diǎn)出汗”或者是“我孩子睡著了”等一系列的方式,會把整個(gè)接收這個(gè)語音的對象變成一個(gè)能考慮問題、能回憶的一個(gè)類人的對象來對話,而不是把它當(dāng)作機(jī)器,被動(dòng)地去接受我們的命令。這是一部分人-智之間的關(guān)系產(chǎn)生的變化。智能體一旦擁有了這些東西,逐漸地在跟你對話的過程中,觀察你使用車的過程,它就會傾向于進(jìn)行全時(shí)的主動(dòng)服務(wù)。當(dāng)然所謂的“全時(shí)主動(dòng)服務(wù)”并不是根據(jù)原來的場景引擎或者是各種任務(wù)編排等功能,并不是簡單地去根據(jù)車上的一些狀態(tài)做觸發(fā),而是它真的能通過端側(cè)的認(rèn)知模型,能看到、聽到、感到,并且還有一個(gè)比較特殊的,也是最近突然間爆發(fā)的Hi Agent,它突然能想到你前天說過的話,我今天是不是應(yīng)該給你提供對應(yīng)的服務(wù),或者是你曾經(jīng)跟我交流過什么,今天是不是對應(yīng)的這個(gè)服務(wù)要產(chǎn)生觸發(fā)的一個(gè)機(jī)會了。所以,全時(shí)的主動(dòng)服務(wù)前置一定是全時(shí)的認(rèn)知,這是我們識別到的在“人-智-體”三方關(guān)系里最先改變的其實(shí)是人跟智之間交互的關(guān)系。而從整個(gè)行業(yè)來看,基本上這個(gè)趨勢也是非常明確的,大家都在通過一系列大模型上車,端側(cè)算力部署,實(shí)現(xiàn)人跟智之間的關(guān)系。但是馬上就會遇到一個(gè)問題,我們都知道車上的交互或者是交流實(shí)際上比較稀疏,長城汽車近千萬用戶的車聯(lián)網(wǎng)數(shù)據(jù),我們平均分析了一下,大概一個(gè)小時(shí)人跟車的交互是4到5次,是非常稀疏的使用過程。即使引入了新的主動(dòng)服務(wù),它也不會時(shí)不時(shí)就給用戶蹦出來一個(gè)東西,然后非常高頻地進(jìn)行服務(wù)。

  對于智跟體之間的關(guān)系,怎么樣把車上所有的這些功能做一個(gè)有效的整合?我們看了一下非常宏觀的行業(yè)分析,從最早的90年代的DOS系統(tǒng),包括后邊的Windows和GUI以及后邊的SOA,給機(jī)器提供這些訪問接口,以及最近通過短短一年的時(shí)間拋出來一堆新的概念MCP、A2A、SKILL、CLI,每一個(gè)概念出來大家都認(rèn)為它很快要火了,為什么這里邊出現(xiàn)越來越多回到了起點(diǎn)一樣的感覺呢?是因?yàn)橐彩前l(fā)現(xiàn)了原來的人跟機(jī)之間交互的形式也在逐漸地演變?yōu)橹虚g的智能體跟具體身體之間的交互,這里邊也會產(chǎn)生比較大的變化,在車上也會陸陸續(xù)續(xù)看到有很多Skills,以及以CRI命令行的方式提供的一系列的接口。所以,人機(jī)交互越來越友好的趨勢開始到讓機(jī)器能夠直接使用機(jī)器的過程,座艙的開發(fā)范式也在不斷變化,原來可能考慮我們要設(shè)置音樂界面,要考慮交互的層級,要考慮車控里功能的聚合,到后邊可能更多地是考慮怎么樣把所有的這些能力原子化,可被直接調(diào)用,包括可被直接的大模型訪問,訪問他們的源數(shù)據(jù),訪問他們的能力。這個(gè)上面的變化,也是整個(gè)座艙的開發(fā)上的一個(gè)巨大的變化。

  在具體的“體”的服務(wù)的類別上,我們也產(chǎn)生了一些細(xì)微的變化。從最直接的車控上面,用戶從原來可能直接希望實(shí)現(xiàn)功能直接的一一映射,比如我說打開空調(diào),調(diào)到多少度,它就應(yīng)該去執(zhí)行。逐漸變?yōu)橛脩粼絹碓缴俚孛枋鼍珳?zhǔn)的命令,而是更模糊地表達(dá)自己的意圖。比如車窗起霧、前面玻璃臟了、我看不到后邊的車等,這種陳述客觀事實(shí)的方式,就需要智能體自己了解車的相關(guān)信息,當(dāng)然知道車的這個(gè)東西并不只是知道車的狀態(tài),里邊還包括車的相關(guān)的知識。比如我們上車之后說“我冷了”,實(shí)際上車上有方向盤加熱、座椅加熱,甚至一些車還有不同位置的環(huán)保式的加熱,比如門板的扶手等都有一些加熱能力,還有空調(diào)的加熱。當(dāng)用戶說“冷了”的時(shí)候,到底它應(yīng)該先開哪個(gè)、后開哪個(gè),以及在不同的情況下是否還需要關(guān)掉別的?這種情況下就需要知道車上所有的這些零部件相關(guān)的一些性能參數(shù)。比如方向盤可能加熱是最快的,它十幾秒左右就能讓你感覺到手已經(jīng)不冷,但是你的手背可能是冷的,你的腳可能是冷的,它會有一個(gè)漸進(jìn)式地加熱過程,這都需要對于整個(gè)車的配置、性能和功能參數(shù)等這些有非常強(qiáng)的一個(gè)了解能力和理解能力,才能實(shí)現(xiàn)真正的智車。認(rèn)人也不是原來的只用考慮坐在副駕、后排這樣位置的差分,我們希望帶來的體驗(yàn)更多的是引入了真正記憶到這個(gè)人是誰。

  舉個(gè)簡單的例子,大家開智能化的汽車有一個(gè)日常的體感,比如車上坐了三個(gè)人,你會坐在后排右側(cè),如果你想打開座椅加熱會怎么描述這個(gè)功能呢?可能腦子里會想,“小魏同學(xué),幫我打開二排右側(cè)座椅加熱”。它腦子里會有一個(gè)復(fù)雜的功能對照的思考過程,我們希望它能演變成一個(gè)方式是什么呢?直接說給mongo或者說給豆豆打開座椅加熱,會變成由智能體理解這個(gè)人坐在哪里,他使用什么樣的方式,你也許看到了他的車窗已經(jīng)處于打開的狀態(tài),是不是先幫她打開車窗,以及出風(fēng)口的方向是不是對準(zhǔn)了這個(gè)人,她的身高是不是都介入了一個(gè)思考的過程。所以,在認(rèn)人的過程里,也是從原來的功能指向性開始變相面向于人服務(wù)的過程。

  當(dāng)然記事可能是用戶對于整個(gè)智能體更高的一個(gè)要求,比如他會提昨天我聽了那個(gè)歌,或者是上周我們?nèi)サ哪莻€(gè)地方,或者是昨天我們聊的那個(gè)東西,他都會作為一個(gè)控制車的上下文或者是背景知識,來更好地提供這樣的服務(wù)和體驗(yàn)。   

  我們發(fā)現(xiàn)大模型有自身的學(xué)習(xí)能力,包括它自己在成長的一個(gè)過程。比如你介紹了這是吳先生,如果你用對應(yīng)的一個(gè)話術(shù)說,給我吳哥或者是給我哥們兒打開這樣一個(gè)功能”,它也是能夠?qū)?yīng)到一個(gè)人。所以在語音技術(shù)的體驗(yàn)上,完全可以做到回歸到用戶自身,完全忽略掉車上到底有什么功能和配置的過程里邊。包括它也會結(jié)合車上不同的亮點(diǎn)的配置,實(shí)現(xiàn)一個(gè)最優(yōu)的體驗(yàn),不是只是你讓它打開空調(diào)的時(shí)候它給你開空調(diào),而是同時(shí)也會讓你的背部、臀部以及手部變得更溫暖的一些方式,它也會同時(shí)給你提供這些對應(yīng)的服務(wù)。

  第二個(gè)“體”的服務(wù)是生態(tài)。這里的“生態(tài)”在車上已經(jīng)非常豐富了。長城汽車接了六家不同的音樂軟件,四家視頻軟件、兩家地圖軟件,包括支持全棧的手側(cè)互聯(lián),我們在座的所有人的手機(jī)在車上都能實(shí)現(xiàn)手側(cè)互聯(lián)。行業(yè)大家一直說在卷,到底卷什么?其實(shí)就是堆料,軟件行業(yè)的堆料已經(jīng)做到了基本上大家能夠在手機(jī)上使用到的生態(tài)在車上都能看到。更夸張的是我們在車上實(shí)現(xiàn)小程序,它的規(guī)模不是像以前一樣可能上二三十個(gè)對應(yīng)的生活服務(wù),而是直接百萬級的服務(wù)直接上車。在極大化豐富的生態(tài)情況下,用戶怎么找到他真正想要的?比如他想播一個(gè)歌,能不能找到那個(gè)最合適的給他播放音樂的人,包括找到到底哪個(gè)買的會員,在哪個(gè)里邊推薦的時(shí)候這個(gè)音樂軟件更能了解他個(gè)性化的偏好,他日常經(jīng)常使用哪些這個(gè)生態(tài),其實(shí)都會找到一些變化。包括這些生態(tài)提供的方式,原來可能更多的是一些界面,你點(diǎn)開這個(gè)應(yīng)用,一級級操作下去,然后用搜索框、分類列表來使用。但是我們發(fā)現(xiàn)可能在很快的一個(gè)未來,就會變成影音的這些內(nèi)容,基本上都是用對話的方式來提供,不再需要關(guān)注一個(gè)app到底長什么樣,也不需要學(xué)習(xí)這個(gè)app的功能和層級的這些方式,它會采用你說的話,直接幫你播放,幫你打開。所以,我們提出來“流式影音”的服務(wù)方式,采用問答的生活服務(wù)的方式,當(dāng)然它也可以接續(xù)后邊支付的能力,比如大家在車上會使用到點(diǎn)餐、點(diǎn)外賣、點(diǎn)咖啡,但是整個(gè)過程中,用戶看到實(shí)際的數(shù)據(jù)并不是他一直在探索新的東西,用戶實(shí)際上在生活里可能點(diǎn)咖啡經(jīng)常點(diǎn)生椰拿鐵,他習(xí)慣性的內(nèi)容實(shí)際上已經(jīng)作為車?yán)铽@取生態(tài)服務(wù)的一個(gè)方式。我們怎么樣在幾百個(gè)不同的咖啡飲品提供的供應(yīng)商的小程序或者是生態(tài)服務(wù)里找到用戶最需要用的那個(gè),可能是未來生態(tài)的一個(gè)重要的解決方案,怎么樣以智能體的方式來統(tǒng)籌生態(tài),實(shí)現(xiàn)無app化的目標(biāo)。

  第三,我們識別到整個(gè)車上的核心服務(wù),其實(shí)就是泛聊天,當(dāng)然這個(gè)聊天不是簡單的“你問我答”,而是它真的能夠幫你通過對話的方式解決一些問題。比如在座的一些可能接觸過語音行業(yè),語音里邊在后臺接一兩百個(gè)信源非常正常,用戶可能會問股票的價(jià)格、新聞、最近茅臺多少錢,以及可能會問類似的,但是在大模型加持或者是AI加持的情況下,我們發(fā)現(xiàn)用戶在問答的邊界已經(jīng)沒有了,他在整個(gè)問答的過程中,會隨時(shí)跳出你給他限定的功能服務(wù)的范圍,他會隨時(shí)打破自己的上下文,可能聊著音樂,他馬上會說你幫我播一下,可能會想知道關(guān)于唱歌這個(gè)人的一些八卦,包括他前兩天是不是有些新聞,包括他在這個(gè)過程中也會直接說我挺喜歡這個(gè)人,就會形成一些記憶的內(nèi)容,也可能產(chǎn)生一些常識上的東西,比如之前說了《明月幾時(shí)有》這樣一首歌,反過來可能問這首詩誰寫的,以及這個(gè)詩人的歷史介紹,包括他所在的朝代等等。將來可能會用聊天的方式,它極有可能會作為用戶的一個(gè)核心提供服務(wù)的方式,并且也會作為極大化的服務(wù)承載方式,包括車控服務(wù)的能力,以及生態(tài)的服務(wù)能力,將來有可能都會以聊天的形式來提供服務(wù),車上的大屏可能只是一個(gè)服務(wù)的可視化的窗口,比如你想顯示歌詞,想顯示具體屏幕影音的東西,或者你想看一個(gè)更大的地圖,它可能是作為一個(gè)屏幕的載體,而原有的人機(jī)交互,人抬起手來去找某一個(gè)功能的事可能極大化地縮減。我們之前看到過去兩年的數(shù)據(jù),用戶用物理按鍵操作整個(gè)屏幕的過程已經(jīng)降了一個(gè)數(shù)量級,基本上從原來一輛車交互2到30次,現(xiàn)在使用語音的過程可能變成個(gè)位數(shù),整個(gè)過程中“人-智-體”核心的服務(wù)將來以對話式的方式或者是聊天的方式,極有可能成為一個(gè)最主要的跟車之間的交流或者溝通的方式。

  除了能自然地聊天之外,其實(shí)它也能夠在使用車上的這些生態(tài)的服務(wù),講一些多媒體的不同的app里邊的內(nèi)容,也能結(jié)合導(dǎo)航、智駕來操縱整個(gè)這輛車上具體的一些體驗(yàn)。也就是整個(gè)智能體在使用這些功能的時(shí)候,已經(jīng)完全地智能體服務(wù)化,而用戶不需要在中間過多地介入,非常像我們在使用小龍蝦的體驗(yàn),它自己在進(jìn)化自己,自己在執(zhí)行自己(的命令),人只需要把自己的意圖表達(dá)進(jìn)去就可以了。燈光的這些功能都是在場景下自己去發(fā)現(xiàn)并且生成出來的,當(dāng)然一些原子的功能肯定是通過SOA或者是Skill的方式打開,它自己會發(fā)現(xiàn)夜間的場景,會發(fā)現(xiàn)它需要轉(zhuǎn)彎,會發(fā)現(xiàn)它需要過窄道。

  整個(gè)這個(gè)體驗(yàn)我們也是用在了長城11款車,車型剛剛準(zhǔn)備發(fā)布,下周會進(jìn)行預(yù)售發(fā)布會,V9X車型,后邊一共11款車會陸續(xù)搭載類似“人-智-體”交互的體驗(yàn),我們整個(gè)執(zhí)行的過程中發(fā)現(xiàn),它就跟我們在場外看到的馬拉松一樣,剛剛開始,我們現(xiàn)在能做到的也只是相識、相知的階段,也就是我剛開始認(rèn)識人,剛開始知道它非常基礎(chǔ)的一些工程師知道的東西,喂給了這個(gè)模型,至于更后邊的比如怎么樣能給用戶提供更美好的生活方式,你在推薦餐廳的時(shí)候不只是常去推薦一個(gè)人均60、70塊錢的餐廳,是不是偶爾在節(jié)假日的時(shí)候也能推薦一個(gè)人均兩三百甚至四五百的,讓你家人可以過一個(gè)浪漫周末的東西,更多地去考慮給你帶來一些更美好的生活方式,這樣的一些過程,其實(shí)現(xiàn)階段還沒有開始,我們也在探索對應(yīng)的一些實(shí)現(xiàn)的方式。包括更多的桌端的介入,比如耳機(jī)的介入、家庭陪伴機(jī)器人的介入、智能眼鏡的介入,是不是可以做全時(shí)的智能體的跟隨,后邊需要走很長一段路。長城汽車可能未來會陸續(xù)地推出三個(gè)平臺來做對應(yīng)的整個(gè)智能體的演進(jìn),下周會發(fā)布VIS,后邊還有歸元A、歸元Q等等不同平臺,搭載不同算力的端側(cè)性能。我們第一代,也是我們認(rèn)為今年行業(yè)里首個(gè)能夠?qū)崿F(xiàn)原生AI艙駕的智能體的車型,大家在樓下可以實(shí)車體驗(yàn)一下。

【獨(dú)家稿件及免責(zé)聲明】本網(wǎng)注明轉(zhuǎn)載文章中的信息僅供用戶參考。凡注明來源“運(yùn)輸人網(wǎng)”的作品,未經(jīng)本網(wǎng)授權(quán)均不得轉(zhuǎn)載、摘編或使用。聯(lián)系郵件:master@yunshuren.com

點(diǎn)擊關(guān)鍵字閱讀相關(guān)文章: 文章來源:網(wǎng)絡(luò)
閱讀
收藏 收藏

評論

評論內(nèi)容最少2字,最多200字
check in
同步到在路上
report
圖片
熱門活動(dòng)
品牌車系用途
推薦品牌
精選車系
說說你的看法 說說你的看法...
join favorite
天台县| 壶关县| 高陵县| 汕尾市| 上犹县| 寿光市| 米泉市| 台南市| 健康| 堆龙德庆县| 吕梁市| 涿州市| 六盘水市| 德庆县| 呼和浩特市| 平顺县| 洪江市| 花莲市| 南投县| 淳安县| 宜都市| 资兴市| 米泉市| 乡城县| 新田县| 宜宾市| 德保县| 榕江县| 苍山县| 偏关县| 静宁县| 容城县| 潮安县| 乌审旗| 山东省| 吉林省| 额尔古纳市| 蒙城县| 邮箱| 龙南县| 贵港市|