李彥宏演講全文如下: 各位來賓,大家好!歡迎來到2023百度世界大會(huì)!歡迎來到生成式人工智能的時(shí)代! 這次大會(huì)的主題是AI原生應(yīng)用。我會(huì)詳細(xì)跟大家分享,過去幾個(gè)月,百度在對(duì)旗下各個(gè)產(chǎn)品線,進(jìn)行AI原生化重構(gòu)過程中的心得體會(huì),希望對(duì)大家有幫助。 眾所周知,AI原生應(yīng)用是基于大模型來開發(fā)的。過去一年,科技領(lǐng)域最大的創(chuàng)新無疑是大模型帶來的智能涌現(xiàn),這是我們開發(fā)AI原生應(yīng)用的基礎(chǔ)。 所以,百度的AI原生應(yīng)用也都是基于我們的文心一言來開發(fā)的。文心一言自今年3月16日首發(fā),之后我們迅速迭代,8月31日又獲準(zhǔn)向全世界開放,獲得了大量的用戶反饋,創(chuàng)新的速度在不斷加快。 今天,我很高興地宣布,文心大模型4.0正式發(fā)布。 我們也同步開始邀請(qǐng)測(cè)試。各位現(xiàn)場(chǎng)的朋友,只需要掃描嘉賓證上的二維碼,領(lǐng)取體驗(yàn)券,就可以登錄文心一言官網(wǎng)或者文心一言App,體驗(yàn)文心大模型4.0了。 這是迄今為止最強(qiáng)大的文心大模型,它實(shí)現(xiàn)了基礎(chǔ)模型的全面升級(jí),理解、生成、邏輯和記憶四大能力,相比文心一言現(xiàn)在的版本都有明顯提升,綜合水平與GPT4相比已經(jīng)毫不遜色! 所謂AI原生應(yīng)用,我的理解,就是基于大模型的理解、生成、邏輯和記憶能力開發(fā)出來的應(yīng)用。這些能力是過去的時(shí)代所不具備的,因而才能打開無限的創(chuàng)新空間。下面我就結(jié)合應(yīng)用場(chǎng)景,給大家介紹一下文心一言的這四大能力。有了這四個(gè)能力的應(yīng)用,才是AI時(shí)代的原生應(yīng)用。 首先是理解能力。這是我接觸大模型之后感受最神奇的地方。過去我們講AI是“人工智障”,就是AI經(jīng)常聽不懂人話,久而久之,你也就不敢跟它說太多人話了。 今天,你說的每一句話,它大概率都能聽懂,很多時(shí)候比你的朋友同事更懂你在說什么。 舉個(gè)例子,你是一位在北京工作的年輕人,想在河北購房,想知道能不能在北京申請(qǐng)公積金貸款。 我們來輸入一行Prompt。 【我想回承德買房,能用公積金貸款嗎,手續(xù)怎么辦?我在北京工作?!?/p>
我們來看一下結(jié)果。文心一言回答說,可以用公積金貸款。為什么說這段問答體現(xiàn)了大模型的理解能力?其實(shí)剛才我給的Prompt,看似簡(jiǎn)單,有好幾個(gè)小陷阱需要理解: 首先,是一個(gè)前后亂序的表述。大部分人打電話提問的時(shí)候,都是想到哪兒說到哪兒,不會(huì)那么嚴(yán)謹(jǐn),就像這個(gè)Prompt,我先說了買房和辦理公積金,最后才說“我在北京工作”,這就對(duì)理解能力提出了更高的要求。 第二,我這里特意用了兩個(gè)比較模糊的表述。一個(gè)是“在北京工作”,潛臺(tái)詞是“在北京繳存公積金”,另一個(gè)是“回承德購房”,僅僅一個(gè)“回”字,其實(shí)暗示了我大概率是承德戶口。 第三,文心一言結(jié)合上下文,把所有信息點(diǎn)組合在一起,準(zhǔn)確理解了真正的問題,也就是“一名河北承德戶籍的用戶,能不能用北京的公積金,在承德貸款購房”,然后針對(duì)這個(gè)問題給出了回答和辦理步驟。 可以看到,文心一言已經(jīng)可以對(duì)“前后亂序的表述,比較模糊的表達(dá)意圖,話語中的潛臺(tái)詞”,都進(jìn)行相當(dāng)準(zhǔn)確的理解。這種能力,在政務(wù)、營(yíng)銷、客服等領(lǐng)域,都有非常廣泛的應(yīng)用前景。 大模型的第二個(gè)重要能力是“生成”,可以生成文字、圖片、視頻等多模態(tài)內(nèi)容。 那么生成能力怎么用?我讓文心一言生成一套廣告素材。 先給它輸入一張圖片,再輸入一段Prompt。 【這是長(zhǎng)安新推出的新能源車。請(qǐng)幫我生成兩張圖片,背景是春天、富有生機(jī)的景色,同時(shí)呈現(xiàn)車的飛馳感?!?/p>
我們看到,這個(gè)生成結(jié)果確實(shí)用到了春天生機(jī)勃勃的戶外景色,還配上了飛馳的模糊感。 我讓它直接給我生成一個(gè)豎版海報(bào)。 【結(jié)合長(zhǎng)安官網(wǎng)上的長(zhǎng)安啟源這款車型的信息,做一張豎版廣告海報(bào),寫上簡(jiǎn)約優(yōu)雅的營(yíng)銷文案,與車身樣式相呼應(yīng)。】 大家看到,我們生成了一個(gè)同時(shí)具備圖片和文字的豎版廣告海報(bào)。 我們現(xiàn)在擁有了一張廣告海報(bào),還需要更豐富的廣告文案,可以請(qǐng)文心一言再來寫幾條: 【這款車強(qiáng)調(diào)數(shù)智座艙、扶光設(shè)計(jì)、品質(zhì)駕乘。請(qǐng)?jiān)賹?條廣告文案,每條文案都需要包含簡(jiǎn)短標(biāo)題和一段描述】 AI寫出來的文案,里面有科技之美、時(shí)代風(fēng)潮這一類表述,還強(qiáng)調(diào)了人機(jī)交互,文案是比較專業(yè)和流暢的,已經(jīng)達(dá)到了品牌營(yíng)銷的標(biāo)準(zhǔn)。 那如果我還想要個(gè)視頻呢? 【請(qǐng)結(jié)合官網(wǎng)信息和已有的視頻內(nèi)容,生成一個(gè)數(shù)字人的口播視頻,我想投放信息流廣告?!?/p>
已經(jīng)生成了,那我們打開視頻看看效果。 這確實(shí)是個(gè)比較有特色的數(shù)字人口播視頻,也體現(xiàn)出了這個(gè)車的特點(diǎn)。 現(xiàn)在,我們擁有了1條廣告片、5個(gè)廣告文案和1張海報(bào),而我僅僅給了文心一言一張圖片素材和幾個(gè)像是“數(shù)智座駕”“品質(zhì)駕乘”的詞語作為Prompt,全程只用了不到3分鐘。 不久前,我們也利用這個(gè)功能推出了AIGC營(yíng)銷創(chuàng)意平臺(tái)擎舵,讓一個(gè)人就成為一支AI營(yíng)銷隊(duì)伍。今天現(xiàn)場(chǎng)可能也有一些做文案策劃的朋友,看到這些,你們會(huì)不會(huì)覺得,大模型可以帶來更多創(chuàng)意上的啟發(fā),幫助你們提高效率? 接下來,我們講一講大模型的第三個(gè)能力:邏輯。 很多人經(jīng)常要給孩子輔導(dǎo)作業(yè)。有人開玩笑說,“不寫作業(yè)母慈子孝,一寫作業(yè)雞飛狗跳”。那我們來看看,文心一言能不能幫家長(zhǎng)解決輔導(dǎo)功課的問題? 我來編一道數(shù)學(xué)題,看看表現(xiàn)如何: 【錐形的沙堆,底面積是8平方米,高12分米,把這堆沙子鋪在寬2米的公路上,厚度5厘米,能鋪多少米路?】 這是一類我們可能小時(shí)候都做過的數(shù)學(xué)題,從文心一言的回答看,它的答題邏輯還是挺清晰的。每一個(gè)解題步驟都寫了出來。家長(zhǎng)們可以看看,是不是比一些輔導(dǎo)教材上給出的還要詳細(xì)。 甚至,AI還能指出解題中用到的知識(shí)點(diǎn),幫助孩子們鞏固學(xué)習(xí),讓我們?cè)賳査幌拢?/p>
【上述解題過程都涉及了哪些知識(shí)點(diǎn)?】 文心一言明確給出了這道題涉及到的圓錐體積公式、統(tǒng)一計(jì)量單位、體積保持不變、解方程等知識(shí)點(diǎn)。這對(duì)于學(xué)生、老師和家長(zhǎng)都很實(shí)用。這些知識(shí)點(diǎn)都清晰的掌握后,將使孩子們具備舉一反三的能力。 大模型超強(qiáng)的邏輯能力,當(dāng)然不僅僅可以用在解題上。智能地圖的路線規(guī)劃、智能助理處理復(fù)雜任務(wù)、智能交通系統(tǒng)中的紅綠燈控制等等,都需要利用邏輯能力。 接下來,我們?cè)倏吹谒狞c(diǎn),也就是大模型的記憶能力。這里的記憶,主要指的是你前面說過的話,AI記不記得住,AI生成的內(nèi)容,前后會(huì)不會(huì)矛盾。這是區(qū)分大模型智能程度的一個(gè)重要指標(biāo),多輪對(duì)話就是記憶能力的體現(xiàn)。 我知道,很多創(chuàng)作者都在利用文心一言寫小說。而小說的內(nèi)容如果前后矛盾,那就沒有可讀性了。今天,我就讓它現(xiàn)場(chǎng)寫個(gè)小說,然后穿插一些干擾性問題,再看看它能不能記住自己寫過的內(nèi)容。 我先輸入一個(gè)Prompt: 【請(qǐng)幫我寫一篇武俠小說,主人公是個(gè)女俠,情節(jié)要跌宕起伏一些?!?/p>
好,我們看,小說的大綱已經(jīng)出來了: 首先是故事背景,在古代的武林世界,黑暗勢(shì)力正在崛起;女主角叫靈兒,擁有操縱內(nèi)力和飛行的力量。 我先輸入一個(gè)Prompt: 【請(qǐng)幫我寫一篇武俠小說,主人公是個(gè)女俠,情節(jié)要跌宕起伏一些。】 好,我們看,小說的大綱已經(jīng)出來了: 首先是故事背景,在古代的武林世界,黑暗勢(shì)力正在崛起;女主角叫靈兒,擁有操縱內(nèi)力和飛行的力量。 接下來,是故事開篇。靈兒要擊敗黑暗勢(shì)力,拯救武林。在小說的最高潮,她和反派進(jìn)行了生死決戰(zhàn),擊敗了反派,拯救了武林和所有門派。 結(jié)尾,靈兒和盟友們還一起建立了內(nèi)力修行所。 現(xiàn)在故事基本成型了,但有點(diǎn)簡(jiǎn)單,我想再增加一些角色需求: 【現(xiàn)在人物關(guān)系太簡(jiǎn)單了,只有兩個(gè)角色,再增加4個(gè)角色】 文心一言又給出了四個(gè)角色,每個(gè)人都有不同的身份和性格,有著不同的人設(shè),這個(gè)慕容孤城是一代宗師,還有一位能預(yù)測(cè)未來的先知蕭寒雁。 但現(xiàn)在還缺一個(gè)小說中的必備要素,戲劇沖突。沒有沖突的故事不是好故事,剛剛女主角打敗黑暗勢(shì)力的過程太簡(jiǎn)單了,我們看能不能加大點(diǎn)難度。 再來輸入一個(gè)Prompt: 【還要給故事增加主線的戲劇沖突,讓故事更有可看性】 我們看,它已經(jīng)寫好戲劇沖突了。這里設(shè)置了一個(gè)反轉(zhuǎn),黑暗勢(shì)力背后,真正的主導(dǎo)者是一位德高望重的宗師級(jí)人物,好幾次讓女主角陷入險(xiǎn)境。直到?jīng)Q戰(zhàn),女主角才有了反殺的機(jī)會(huì)。 可以看到,它記住了故事主線是靈兒與黑暗勢(shì)力的對(duì)決,沖突也是圍繞這一主線展開。 那么,文心一言現(xiàn)在還記得剛寫過的故事,并且把這些角色和故事對(duì)應(yīng)上嗎? 我們?cè)賮硖醾€(gè)需求: 【把這些角色帶入到你給我設(shè)計(jì)的故事大綱中吧,并且設(shè)計(jì)個(gè)標(biāo)題?!?/p>
結(jié)果已經(jīng)顯示到大屏幕上,小說叫做《江湖風(fēng)云之正義之戰(zhàn)》,它把補(bǔ)充的人物和戲劇沖突加入到了故事大綱里。這里的第四章和第五章,它還告訴我們,這個(gè)反派的大宗師,就是剛剛介紹過的慕容孤城。 整個(gè)過程中,我不斷加大難度、提出新的要求,去干擾它的記憶,文心一言依然記住了前面所有的需求和答案,能把故事情節(jié)和人物準(zhǔn)確地對(duì)應(yīng)上,記憶力非常驚人。 那我現(xiàn)在考考現(xiàn)場(chǎng)的大家,你們還記得,主人公靈兒的特殊能力是什么嗎? 可能大部分人都不記得了,那我們看看文心一言還記得嗎? 【女主角擁有的能力是什么?】 好,答案出來了,是操縱內(nèi)力和飛行的力量。這就是在第一輪對(duì)話中,文心一言寫下的示例文字。現(xiàn)在經(jīng)過五輪對(duì)話和幾千字的小說撰寫之后,它還是能記得之前寫過的內(nèi)容,這就是大模型的記憶能力。 我們剛剛體驗(yàn)了大模型的四大能力,當(dāng)然,大部分時(shí)候,這四項(xiàng)能力都不是單一出現(xiàn)的,是相輔相成的。比如,創(chuàng)作一個(gè)廣告文案,它需要理解創(chuàng)作主題、理清創(chuàng)作邏輯,通過記憶來保持前后一致。 在解題中,也需要綜合應(yīng)用理解、生成、邏輯、記憶能力。 我們?cè)賮砜匆粋€(gè)綜合應(yīng)用的案例: 首先,我們打開重構(gòu)后的百度App,用攝像頭掃一下患者拿出的藥盒,就不用再翻看小字說明書了,還有數(shù)字人醫(yī)生幫你講解。 剛才屏幕上出現(xiàn)的問題,比如“是飯前吃還是飯后吃”、“喝酒能不能吃”,“還有什么注意事項(xiàng)”,是很多患者在日常用藥中都會(huì)遇到的問題。 我們看到,大模型不僅可以幫患者做用藥說明書的解讀,還可以結(jié)合個(gè)性化的需求,提升用藥效率,確?;颊叻幍臏?zhǔn)確性、及時(shí)性。 不久前,我們將文心大模型和專業(yè)的醫(yī)療知識(shí)結(jié)合,發(fā)布了靈醫(yī)大模型,它的上層應(yīng)用靈醫(yī)Bot,就可以幫患者和醫(yī)生對(duì)話、生成病歷。這個(gè)例子不僅用到理解生成邏輯記憶能力,還用到了語音,視覺等多模態(tài)的能力。 前面的演示,主要體現(xiàn)出文心大模型在理解、生成、邏輯、記憶這四大能力上的進(jìn)步,這些能力是一切AI原生應(yīng)用賴以生存的基礎(chǔ)。同樣,沒有構(gòu)建于基礎(chǔ)模型之上的、豐富的AI原生應(yīng)用生態(tài),大模型就一文不值。 正因?yàn)槿绱?,我在五月份公開說,百度要做第一個(gè)把所有產(chǎn)品都進(jìn)行重構(gòu)的公司,我們要用AI思維,做出AI原生應(yīng)用。 幾個(gè)月過去,我們的搜索、如流、地圖、網(wǎng)盤、文庫等,都將以一個(gè)全新的面目,與大家見面。期間踩過不少的坑,也愿意跟大家分享,希望你們開發(fā)過程中能夠少走歪路。 下面,我就給大家展示一下,這些用大模型重構(gòu)的產(chǎn)品,究竟長(zhǎng)啥樣兒?這也是為了拓展大家的想象力,激發(fā)大家一起來做出更驚艷的AI原生應(yīng)用來。 我首先向大家展示的是搜索,這也是百度的起點(diǎn)。很多人對(duì)搜索的印象是,你輸入一個(gè)關(guān)鍵詞,百度給你一個(gè)個(gè)網(wǎng)頁鏈接。Not anymore! 百度新搜索,打開界面時(shí),除了還能看到一個(gè)搜索框,搜索結(jié)果將和過去完全不同。 重構(gòu)后的新搜索,有三個(gè)特點(diǎn):極致滿足、推薦激發(fā)、多輪交互。 什么是極致滿足?當(dāng)你在搜索框里輸入問題,比如“MBTI是什么?”“怎么側(cè)方停車”,新搜索不再是給你一堆鏈接,而是通過大模型去理解,生成一個(gè)最好的答案。 比如,詢問“過去20年各國(guó)工業(yè)增加值排名”,新搜索不僅會(huì)直接告訴你答案,還能用動(dòng)態(tài)的圖表來展現(xiàn)答案。 從我身后的大屏幕可以看到,過去二十年,我們的工業(yè)制造業(yè)經(jīng)歷了飛速的發(fā)展,正從制造大國(guó)向著制造強(qiáng)國(guó)轉(zhuǎn)變。 這就是極致滿足:一步給你最極致的答案。 那么第二步,看到答案后,你還想看到哪些內(nèi)容? 這里就用到了推薦激發(fā)。比如在動(dòng)態(tài)圖之后,推薦激發(fā)功能還給出了“工業(yè)增加值與GDP有什么關(guān)系” “工業(yè)對(duì)國(guó)民經(jīng)濟(jì)發(fā)展有何影響”這些你還可能關(guān)心的問題。點(diǎn)擊就能得到答案。 當(dāng)然,并非所有需求都有一個(gè)唯一正確的答案。用戶的需求有時(shí)候會(huì)很復(fù)雜,一句兩句話說不清楚。用戶也很難把一個(gè)非常復(fù)雜的需求,一次性地通過大段大段的描述完整表述出來。 這時(shí)候,我們就需要用一個(gè)更新穎、更個(gè)性化的搜索模式來服務(wù)用戶,這就是:多輪交互。 我們來看一下這個(gè)例子: 比如,你詢問“北京周邊登山去哪兒比較推薦”,它給出了百花山、海坨山等多個(gè)答案,偏向徒步路線; 然后,它給出幾個(gè)提示,讓你補(bǔ)充選擇自己的情況,你可以選擇新手、親子和觀賞落葉幾種情況?,F(xiàn)在,它改為推薦西山和百望山,相對(duì)好爬,而且對(duì)親子活動(dòng)比較友好。 那再繼續(xù)詢問,登山徒步需要什么裝備?回答有登山杖、登山鞋等,而且它還記得前面選擇了親子游,特別提示了怎么照顧小朋友。 可以說,生成式AI與搜索是天作之合。 搜索,雖然還是從那個(gè)簡(jiǎn)單的框開始,但接下來的一步步,都已超越、重構(gòu)了原來的搜索模式,不僅提升了搜索質(zhì)量,而且突破了搜索的應(yīng)用范圍、擴(kuò)大了產(chǎn)品邊界。這樣的 AI互動(dòng)式搜索,將引領(lǐng)搜索行業(yè)的代際變革。 不久的將來,搜索會(huì)變成一個(gè)貼心助手,能夠隨時(shí)喚起、解決問題,甚至打破“端”的限制,做到隨時(shí)隨地響應(yīng)、滿足所需,全程陪伴。 下面,我們來看看第二個(gè)AI原生思維產(chǎn)品,百度GBI,Generative Business Intelligence,也就是生成式商業(yè)智能。這是一個(gè)從零開始的產(chǎn)品,不是對(duì)已有產(chǎn)品的重構(gòu)。 在我們的商業(yè)世界里,最離不開的就是商業(yè)分析,也就是BI,怎么做出最快的商業(yè)決策?先讓大家通過一個(gè)視頻,感受一下: 大家看到,在視頻里,總裁問了多方面的專業(yè)問題。有財(cái)務(wù)分析的、項(xiàng)目交付的,還有用戶分析的,運(yùn)用了GBI的總裁助理,都能快速給出結(jié)果,讓總裁當(dāng)場(chǎng)決策。 這就是基于大模型能力的決策利器,國(guó)內(nèi)首個(gè)生成式商業(yè)智能產(chǎn)品,百度GBI。用GBI,干啥都快! 掌握先進(jìn)工具的人不僅不會(huì)被AI取代,而且“升職加薪不是夢(mèng)”。不使用先進(jìn)工具的人,才會(huì)有丟工作的風(fēng)險(xiǎn)。 那么,百度GBI是怎么做到快人一步的?它從三個(gè)方面顛覆了傳統(tǒng)的數(shù)據(jù)分析: 首先,傳統(tǒng)BI只有專業(yè)人士才能操作,而GBI能直接聽懂總裁問題,實(shí)時(shí)執(zhí)行; 其次,GBI提供了便捷的接入方式,企業(yè)可以接入數(shù)據(jù),對(duì)任意數(shù)據(jù)用自然語言進(jìn)行提問、分析,而不再需要人工去跨數(shù)據(jù)庫、跨表格做各種專業(yè)操作; 第三,GBI還具備學(xué)習(xí)能力,企業(yè)可注入本行業(yè)專業(yè)知識(shí),讓它成為行業(yè)專家。 這就是百度GBI,它可以把商業(yè)分析師十幾天才能完成的數(shù)據(jù)分析、撰寫報(bào)告工作,縮短到分鐘級(jí)。所謂天下武功,唯快不破;企業(yè)競(jìng)爭(zhēng),不是大魚吃小魚,而是快魚吃慢魚,比競(jìng)爭(zhēng)對(duì)手更快決策,很可能你就贏了! 說到快速?zèng)Q策,在百度,我們依賴一個(gè)智能辦公平臺(tái)叫做如流,我們也利用AI重構(gòu)了這個(gè)應(yīng)用。 如今,它已經(jīng)成為百度人離不開的超級(jí)助理。 現(xiàn)在大家請(qǐng)看,這是如流在做實(shí)時(shí)記錄。我們來看看,它是不是能把剛剛講過的要點(diǎn)內(nèi)容都記?。?/p>
這就是如流的會(huì)議紀(jì)要一鍵生成功能。我們說,如何高效地開會(huì),是個(gè)技術(shù)活兒。如流的這個(gè)功能,極大地減少了會(huì)議工作量,讓開會(huì)時(shí)長(zhǎng)縮短了40%。 另外一個(gè)常見的場(chǎng)景是工作群。大部分職場(chǎng)人常常被各種群聊信息轟炸。那么快速總結(jié)群聊的重點(diǎn),就成了一個(gè)極為實(shí)用的功能。 下面請(qǐng)大家看看,我們?nèi)缌鞯漠a(chǎn)品經(jīng)理是如何使用它的。 他有9個(gè)工作群,耽擱一段時(shí)間,可能就有一千多條未讀信息,而如流不僅可以“1000條消息,一秒get重點(diǎn)”,還可以智能地把需要閱讀的內(nèi)容分為:“待我確認(rèn)”、“重點(diǎn)關(guān)注”、“話題討論”幾個(gè)類別,大大提高了工作效率。 那它究竟提煉得準(zhǔn)不準(zhǔn),會(huì)不會(huì)理解有誤,或者漏掉關(guān)鍵信息?這考驗(yàn)的就是大模型的理解和生成能力。理解越深刻,總結(jié)越精確。不要說1000條,1萬條信息,如流超級(jí)助理也一樣可以在幾秒鐘內(nèi),就給出智能分類、智能總結(jié)。 我們?cè)倏纯垂ぷ髦械牧硪粋€(gè)場(chǎng)景:差旅。 機(jī)票、酒店、談參等等,這些事務(wù)性的工作很繁瑣、也很耗時(shí)!如果人手一個(gè)AI助理,幫你解決瑣碎事兒,你會(huì)不會(huì)更愛工作? 比如,最近如流的產(chǎn)品經(jīng)理就計(jì)劃出差去上海,和人保的王總見面。我們知道,人保集團(tuán)正在推動(dòng)產(chǎn)品服務(wù)、商業(yè)模式、數(shù)字科技等方面的創(chuàng)新,我們百度的人工智能技術(shù)正好可以發(fā)揮作用。 這次出差行程安排,就可以交給如流這個(gè)超級(jí)助理,我們一起來看看它的表現(xiàn)。 超級(jí)助理可以根據(jù)他的日程信息來安排行程。 像最晚的會(huì)議是4點(diǎn)結(jié)束,所以預(yù)定7點(diǎn)半之后的飛機(jī);以及,按照他的差旅標(biāo)準(zhǔn),幫他找到可以住宿的酒店。最后,還發(fā)出了和客戶的會(huì)邀。 和客戶見面前,他可能需要一些合作背景,這點(diǎn)如流的超級(jí)助理也可以幫他完成。通過和CRM等公司系統(tǒng)數(shù)據(jù)打通,如流給出了合作項(xiàng)目、拜訪記錄等細(xì)節(jié)數(shù)據(jù)。 通過理解業(yè)務(wù)合作情況和外部信息,如流還能幫他生成一份談參,預(yù)設(shè)客戶可能提出的問題,還會(huì)給出一些合作建議。從這點(diǎn)看,如流是不是更像一個(gè)真實(shí)的助理了? 我們剛剛看到,只說三句話,如流就搞定了差旅單、機(jī)酒和日程的預(yù)訂,甚至還準(zhǔn)備了洽談的參考資料,這就是如流的“一鍵差旅”。它是怎么做到的呢? 這是大模型的理解、生成、邏輯、記憶能力的綜合應(yīng)用,它自動(dòng)地把復(fù)雜任務(wù),拆解成多個(gè)簡(jiǎn)單任務(wù)分別執(zhí)行,再合并生成最終的結(jié)果。我們說,提升效率,就是提升競(jìng)爭(zhēng)力,如流讓“智能工作”代替“勤奮工作”。 現(xiàn)在,我們?cè)賮砜纯葱碌陌俣任膸?。這也是我認(rèn)為目前重構(gòu)最徹底的一款產(chǎn)品。 百度文庫將會(huì)徹底顛覆我們的辦公、學(xué)習(xí)和創(chuàng)作的習(xí)慣。 過去,我們是怎樣創(chuàng)作的?舉個(gè)例子,假設(shè)你要做一場(chǎng)演講,主題是AI在心理學(xué)領(lǐng)域的應(yīng)用。查資料、整理素材、寫稿、寫PPT、美化PPT,得花上好幾天時(shí)間。 今天,在百度文庫上,你可以用一句話啟動(dòng)工作,請(qǐng)看大屏幕:首先,你希望它能撰寫一篇演講稿,圍繞人工智能和心理學(xué)這個(gè)主題,它找到了幾十份資料。 還能識(shí)別出哪些是學(xué)術(shù)期刊、權(quán)威報(bào)告,哪些只是大眾材料。如果你想寫一篇生動(dòng)活潑的文章,就去選一些大眾素材,比如散文、科普類的。 那如果你想要一篇嚴(yán)謹(jǐn)?shù)膶W(xué)術(shù)演講稿,就可以只勾選權(quán)威內(nèi)容,保證內(nèi)容的準(zhǔn)確。然后,文庫通過理解這些文稿資料,再生成一篇結(jié)構(gòu)完整、段落清晰的文章,同時(shí)對(duì)內(nèi)容做出潤(rùn)色和排版。 能做到這些,是因?yàn)榘俣任膸煲呀?jīng)擁有了10億優(yōu)質(zhì)文檔,基于對(duì)這些內(nèi)容的理解,寫出真正實(shí)用、清晰的文稿,而不是像很多大模型一樣一本正經(jīng)地胡說八道,也不會(huì)是泛泛的空談。 下一步,演講還需要PPT。文庫可以把剛剛這篇稿子和你收藏過的一些資料結(jié)合,自動(dòng)生成PPT的框架,然后美化作圖,做出一個(gè)幾十頁的PPT。 這里還有一些多模態(tài)生成能力的玩法,比如風(fēng)格選擇、風(fēng)格一鍵切換。但還有一些更考驗(yàn)文庫能力的地方,需要它對(duì)內(nèi)容有精準(zhǔn)的理解。比如,它要知道觀點(diǎn)之間的關(guān)系,是并列,還是從屬,才能設(shè)計(jì)出正確的圖表。 因?yàn)橛羞@樣的理解能力,所以文庫在生成PPT基礎(chǔ)上,還可以為這份PPT寫好對(duì)應(yīng)的演講稿。不僅如此,它還能根據(jù)這些內(nèi)容,推演出觀眾可能會(huì)提出的問題,為你準(zhǔn)備好回答。 我們?cè)u(píng)測(cè)過,文庫這些生成能力,尤其是PPT的生成能力,已經(jīng)遠(yuǎn)超市場(chǎng)上任何其他工具,不論國(guó)外還是國(guó)內(nèi)。過去,人們來文庫是為了找現(xiàn)成的內(nèi)容。今后,人們可以隨心所欲地來文庫生產(chǎn)內(nèi)容,效率高于任何其他生產(chǎn)力工具。 基于文心大模型的四大能力,不夸張地說,百度文庫是從根本上革了自己的命,完成了從“內(nèi)容工具”向“生產(chǎn)力工具”的進(jìn)化。 不久前,百度文庫新版本開放首日,AI新功能就迎來超過200萬人次體驗(yàn)?,F(xiàn)在,我們更加有信心說,大模型時(shí)代,百度文庫是生產(chǎn)內(nèi)容最好的起點(diǎn)。 和文庫一樣,百度網(wǎng)盤也是大家熟悉的老朋友了。過去11年,百度網(wǎng)盤為8億用戶服務(wù),文件量級(jí)已經(jīng)達(dá)到了4萬億,每一天用戶會(huì)上傳超過10億張圖片。所以,百度網(wǎng)盤在AI重構(gòu)的方向上,重點(diǎn)就是做好個(gè)人文件的智能服務(wù)。 大家現(xiàn)在看到的,就是百度網(wǎng)盤的新首頁。 重構(gòu)后的網(wǎng)盤,不但實(shí)現(xiàn)了從圖形界面交互到自然語言交互的轉(zhuǎn)變,還增強(qiáng)了多模態(tài)信息理解。 現(xiàn)在,只需要一句話,你就能對(duì)自己網(wǎng)盤內(nèi)的文件、圖片、視頻等進(jìn)行操作。 這就是百度網(wǎng)盤“云一朵”,它是業(yè)界乃至全球首個(gè)個(gè)人云智能助理。下面就讓我們感受一下,“云一朵”能解決哪些痛點(diǎn),帶來新體驗(yàn)? 第一點(diǎn)就是找圖片或找視頻。有時(shí)候,我們想起來一個(gè)畫面,想在網(wǎng)盤中找到它,往往要經(jīng)過很多步操作,折騰半天也找不到。現(xiàn)在,你對(duì)“云一朵”說一句話,它就能幫你精準(zhǔn)定位: 好,它幫我快速找到了OpenAI首席科學(xué)家llya采訪中,關(guān)于transformer的內(nèi)容。 在這次看似簡(jiǎn)單的搜索背后,是多個(gè)AI能力的作用,它要能理解視頻內(nèi)容、識(shí)別角色、還要形成上下文的記憶,才能精準(zhǔn)定位到視頻的某一幀,這個(gè)技術(shù)在全球個(gè)人云領(lǐng)域都是非常領(lǐng)先的。 云一朵的第二個(gè)特點(diǎn),是幫助用戶快速了解視頻的內(nèi)容,我們來看一下: 大家看到演示了兩個(gè)能力,一個(gè)是對(duì)內(nèi)容進(jìn)行總結(jié)和摘要的能力,還有提取金句的能力。這是一段43分鐘的采訪,通過AI的理解和邏輯能力,云一朵對(duì)視頻做了總結(jié)和提煉,介紹了llya和他的主要觀點(diǎn)。 但是很多時(shí)候,我們會(huì)覺得原文很精彩,提煉出主要觀點(diǎn)或者摘要后,就沒有那么吸引人了,所以剛才的第二個(gè)功能,我覺得其實(shí)對(duì)我來說更有用,也就是說我們要找到原來視頻當(dāng)中最精彩的部分,就是那些金句。比如llya說“學(xué)習(xí)統(tǒng)計(jì)規(guī)律比看到表象要重要得多”。能提煉出這個(gè)金句,這其中的關(guān)鍵突破是,實(shí)現(xiàn)了多模態(tài)信息的高效提取,這個(gè)技術(shù)在全球都是領(lǐng)先的。它能夠從很長(zhǎng)的訪談內(nèi)容中找到最精華的部分,極大地提高了我們的學(xué)習(xí)和工作效率。 這就是AI重構(gòu)后的新網(wǎng)盤。截至昨天,云一朵用戶已經(jīng)達(dá)到2000萬。 它是基于個(gè)人云的AI智能助理。過去十年,百度定義了什么叫網(wǎng)盤;未來十年,百度將用AI重新定義新的網(wǎng)盤。 接下來,我們來看一個(gè)更為歷史悠久的產(chǎn)品,百度地圖。我們用AI原生的思維重構(gòu)了這個(gè)18年歷史的產(chǎn)品,這也是全球首個(gè)AI原生地圖產(chǎn)品。 在過去的18年中,百度地圖積累了非常豐富的功能,它可以導(dǎo)航、打車、找代駕,還能訂酒店、買機(jī)票,甚至滿足更為復(fù)雜條件下的POI查找需求。過去,這些操作復(fù)雜,往往需要六七步甚至更多才能完成; 現(xiàn)在,用戶只要說出需求,地圖就能調(diào)動(dòng)幾千個(gè)服務(wù)的API接口,多級(jí)菜單變成一步直達(dá),快速響應(yīng)。 我們接下來看看,百度地圖是怎么實(shí)現(xiàn)的? 視頻里,用戶考驗(yàn)了百度地圖對(duì)泛需求的理解,中間聚會(huì)點(diǎn)的選取、多地點(diǎn)的信息對(duì)比,以及未來出行的推薦和預(yù)約,它都給出了合理方案。 這是因?yàn)槲男囊谎缘哪芰?,已?jīng)與地圖特有的億級(jí)POI知識(shí)和萬億級(jí)交通感知數(shù)據(jù)進(jìn)行了融合,能隨時(shí)調(diào)用,給出推薦。重構(gòu)后的百度地圖,不只是導(dǎo)航,更是我們的出行向?qū)?。越用越聰明,越來越懂你?/p>
剛剛,我們展示了6個(gè)線上的AI原生應(yīng)用,但大模型帶來的改變不僅如此,它也在影響著我們線下的工作和生活。 比如,用大模型重構(gòu)的汽車車內(nèi)空間,是否會(huì)給我們帶來驚喜?來看一段本月底即將交付的集度極越的視頻。 當(dāng)大模型與智能座艙相結(jié)合,你與它交互得越多,它就越能理解你的需求。不再需要復(fù)雜的按鍵操作,用語音就能操控車內(nèi)的一切,讓智能座艙擁有邏輯推理、策略規(guī)劃和內(nèi)容生成等各種能力。 即使在七嘴八舌、多人指令、聲音交織、連續(xù)對(duì)話的情況下,它也能理解每個(gè)人不同的需求,同時(shí)滿足。 這些能力已率先落地在由集度設(shè)計(jì)的極越01汽車機(jī)器人上,百度Apollo將在EQ、IQ兩方面全面賦能這款新車,極越01也將成為最聰明、最懂你的汽車機(jī)器人。 今天,相信大家已經(jīng)感受到了AI的巨大能量,我更相信,大模型將開啟一個(gè)繁榮的AI原生應(yīng)用生態(tài)。 談到生態(tài),不能不提插件,它非常重要,能讓開發(fā)者、創(chuàng)業(yè)者快速加入到生態(tài)中。 插件是一種特殊的AI原生應(yīng)用,也是門檻最低,最容易上手的AI原生應(yīng)用。不久前,百度上線了靈境插件平臺(tái),無論是個(gè)人或者企業(yè)的數(shù)據(jù)、能力還是應(yīng)用,都能在靈境平臺(tái)上,快速變成插件。 舉個(gè)例子,你從網(wǎng)上買了個(gè)東西,賣家發(fā)貨與實(shí)物不符,咨詢?cè)趺匆筚r償? 這里,法律智能助手就可以給出建議,因?yàn)樗尤肓酥袊?guó)司法大數(shù)據(jù)研究院這種官方權(quán)威機(jī)構(gòu)提供的插件。 再比如,畢業(yè)求職季,簡(jiǎn)歷很重要。你想做一名AI算法工程師。 沒問題,看一下,只要輸入包含背景信息的Prompt,大模型通過調(diào)用插件,就能幫你一鍵生成簡(jiǎn)歷模板。 插件增強(qiáng)了大模型的能力,讓它更實(shí)用、更易用,也使得很多企業(yè)私有數(shù)據(jù)在沒有泄露風(fēng)險(xiǎn)的情況下,能方便快捷地利用到大模型的能力,更能降低開發(fā)者的門檻,促進(jìn)AI生態(tài)的繁榮。 現(xiàn)在,靈境插件平臺(tái),上線短短一個(gè)月,已經(jīng)有2.7萬開發(fā)者申請(qǐng)入駐,覆蓋20多個(gè)領(lǐng)域,除了法律咨詢、簡(jiǎn)歷生成外,還有腦圖制作、口語練習(xí)等各種各樣的場(chǎng)景。 AI原生應(yīng)用調(diào)用基礎(chǔ)大模型的主要方式是API。在百度的千帆大模型平臺(tái)上,企業(yè)可以快速調(diào)取包括文心一言在內(nèi)的各種大模型的API,獲得大模型的能力。 現(xiàn)在,千帆大模型平臺(tái)已經(jīng)成為了中國(guó)最大、最開放的大模型開發(fā)平臺(tái),不僅有42個(gè)主流大模型入駐,而且有17000家企業(yè)在這里開發(fā)產(chǎn)業(yè)模型和解決方案,覆蓋了各行各業(yè)的近500個(gè)場(chǎng)景。 從今天起,企業(yè)客戶可以通過千帆來申請(qǐng)測(cè)試文心4.0的API了。中國(guó)有豐富的應(yīng)用場(chǎng)景,中國(guó)用戶又天然愿意擁抱新技術(shù),有了先進(jìn)的基礎(chǔ)大模型,我們就能構(gòu)建起一個(gè)繁榮的AI生態(tài),共同創(chuàng)造新一輪經(jīng)濟(jì)增長(zhǎng)。 隨著這一波AI浪潮的到來,也有些人會(huì)擔(dān)心會(huì)不會(huì)被AI所取代。但我們首先看到的實(shí)際情況是——AI不僅不會(huì)替代人,AI還能救人。 10秒鐘完成預(yù)警,10分鐘完成救援,哪怕是在瞬息萬變的現(xiàn)實(shí)里,AI也能依據(jù)風(fēng)險(xiǎn)排查的邏輯,通過對(duì)復(fù)雜圖像、語言的理解,第一時(shí)間找到潛在風(fēng)險(xiǎn)點(diǎn),發(fā)出預(yù)警,避免悲劇發(fā)生。 最后,我還想說,未來的AI原生應(yīng)用一定是多模態(tài)的,在信息世界之外,一定會(huì)重構(gòu)物理世界。自動(dòng)駕駛就是視覺大模型重構(gòu)物理世界的一個(gè)典型應(yīng)用。 大模型會(huì)讓百度的自動(dòng)駕駛能力超越經(jīng)驗(yàn)系統(tǒng),更聰明地處理復(fù)雜場(chǎng)景,實(shí)現(xiàn)更廣泛的時(shí)空覆蓋。 下面就請(qǐng)我的同事震宇帶大家感受一下,請(qǐng)看大屏幕。 今天,百度自動(dòng)駕駛出行服務(wù)平臺(tái)蘿卜快跑,已經(jīng)是全球最大的自動(dòng)駕駛出行服務(wù)商,累計(jì)提供了超過400萬次載客服務(wù)。蘿卜快跑的全無人車,已經(jīng)跑在武漢、重慶、北京、上海、深圳等城市的很多個(gè)區(qū)域。 我相信,隨著運(yùn)營(yíng)規(guī)模的不斷擴(kuò)大、技術(shù)水平的不斷提升,成本更低的自動(dòng)駕駛車輛的規(guī)?;渴?,蘿卜快跑將越來越接近商業(yè)化盈利。 讓我們共同期待,AI原生出行時(shí)代的到來。 隨著大模型技術(shù)不斷提升,我堅(jiān)信,從今往后,大量AI原生應(yīng)用將不斷涌現(xiàn),數(shù)字技術(shù)與實(shí)體經(jīng)濟(jì)將深度融合。 我們的大模型技術(shù)已應(yīng)用在制造、能源、電力、化工、交通等實(shí)體產(chǎn)業(yè)中。 用智能巡檢降低安全隱患、用智能調(diào)度縮短交付周期、用智能決策提升企業(yè)效率、用智能信控解決交通擁堵…大模型正成為新型工業(yè)化的重要推動(dòng)力。 《時(shí)代》周刊在一期封面文章中寫道,“AI的獨(dú)特性…是它不僅能模仿人類的某些技能,還能執(zhí)行我們難以完成的任務(wù)。然而,推動(dòng)機(jī)器學(xué)習(xí)和大語言模型每一次進(jìn)步的背后,其實(shí)都是人類?!?對(duì)這句話,我非常贊同。 新的世界、新的未來,將在每個(gè)企業(yè)、每個(gè)開發(fā)者、每位用戶的一次次Prompt中生成。我們即將進(jìn)入一個(gè)AI原生的時(shí)代,進(jìn)入一個(gè)人機(jī)通過prompt來交互的時(shí)代,未來將由你生成!未來由我們一起生成!謝謝大家!