2023-09-09 02:55:49 來源 : 經(jīng)濟(jì)日?qǐng)?bào)新聞客戶端
(資料圖片僅供參考)
從ChatGPT引發(fā)的追捧到“百模大戰(zhàn)”,大語言模型和生成式人工智能發(fā)展十分迅速。9月8日,清華大學(xué)計(jì)算機(jī)系教授、海致科技首席科學(xué)家鄭緯民發(fā)布了由海致科技與高性能圖計(jì)算院士工作站共同開發(fā)的“Atlas LLM知識(shí)圖譜與大模型融合應(yīng)用平臺(tái)”,該平臺(tái)運(yùn)用知識(shí)圖譜技術(shù),實(shí)現(xiàn)基于行業(yè)與場景的精準(zhǔn)推演。目前已經(jīng)在能源、金融、政務(wù)等領(lǐng)域的場景中進(jìn)行部署和應(yīng)用,力圖打通通用人工智能進(jìn)入工業(yè)應(yīng)用的“最后一公里”。
日前,由中國電子技術(shù)標(biāo)準(zhǔn)化研究院、全國信標(biāo)委等單位發(fā)起,海致科技全程參與的《知識(shí)圖譜與大模型融合實(shí)踐報(bào)告》也已經(jīng)正式發(fā)布,上述成果以及部分應(yīng)用案例也將為業(yè)界共享,推動(dòng)更多市場主體和技術(shù)力量參與到通用人工智能的多技術(shù)融合之中。
鄭緯民表示,知識(shí)圖譜作為更加類腦的人工智能工具,其知識(shí)推導(dǎo)能力可以跟大模型相互補(bǔ)充,反過來,大模型的快速學(xué)習(xí)能力,對(duì)于知識(shí)圖譜的知識(shí)生成也產(chǎn)生了很好的促進(jìn)。
大語言模型的基本工作方式是分析文本中的詞匯、句法結(jié)構(gòu)、語義信息等,并捕捉它們之間的模式和概率分布,因此,它更傾向于基于統(tǒng)計(jì)規(guī)律生成回答,而非進(jìn)行深入的邏輯推理或形成高級(jí)的認(rèn)知能力。另外,它在生成文本時(shí)可能會(huì)受限于訓(xùn)練數(shù)據(jù)中存在的偏見和誤導(dǎo)性信息,在某些情況下可能會(huì)產(chǎn)生不準(zhǔn)確或不合理的回答。對(duì)于這種基于技術(shù)特征產(chǎn)生的瑕疵,人們將其形象比喻為“大模型幻覺”。這種不期而遇的“幻覺”正是以大模型為代表的通用人工智能進(jìn)入商用最大的挑戰(zhàn)。
在這一背景下,另一種被廣泛應(yīng)用的人工智能基礎(chǔ)技術(shù)——知識(shí)圖譜作為公認(rèn)“類腦”的知識(shí)表達(dá)方式,通過對(duì)語義網(wǎng)絡(luò)進(jìn)行建模,以結(jié)構(gòu)化的形式描述客觀世界中實(shí)體及關(guān)系,被廣泛應(yīng)用于知識(shí)推理。
海致科技高級(jí)副總裁瞿珂列舉了該平臺(tái)已經(jīng)驗(yàn)證的一個(gè)工業(yè)場景:在工業(yè)制造設(shè)備運(yùn)檢領(lǐng)域中,復(fù)雜生產(chǎn)系統(tǒng)的故障識(shí)別因其故障組合類型復(fù)雜、數(shù)據(jù)異構(gòu)、以及要求反應(yīng)速度很快,一直是人們對(duì)人工智能寄予厚望的領(lǐng)域?!斑^去我們通過利用知識(shí)圖譜技術(shù),可以將設(shè)備間關(guān)系以及關(guān)聯(lián)設(shè)備量測信號(hào)構(gòu)建成故障知識(shí)特征子圖來幫助機(jī)器自動(dòng)實(shí)現(xiàn)故障識(shí)別,但是這一過程需要業(yè)務(wù)專家配合技術(shù)人員開展大量的實(shí)體構(gòu)建和配置工作為先決條件,才能實(shí)現(xiàn)知識(shí)生成。但是今天我們可以通過大模型極大地提高這一知識(shí)抽取和融合的過程效率,一方面,通過大模型對(duì)故障設(shè)備及關(guān)聯(lián)量測值的快速提取,幫助知識(shí)圖譜完成特征圖的快速構(gòu)建,提高效率;另一方面,也可以通過業(yè)務(wù)專家對(duì)大模型自動(dòng)生成的特征圖進(jìn)行更為高效的校驗(yàn),固化和校準(zhǔn)故障特征的經(jīng)驗(yàn)知識(shí),確保質(zhì)量。”