01
大模型技術(shù)的性能和遷移性顯著超越此前模型,具備支持行業(yè)智能化的巨大潛力
自ChatGPT模型于2022年底問(wèn)世以來(lái),大模型以其強(qiáng)大的多輪對(duì)話能力、多場(chǎng)景多任務(wù)適應(yīng)能力和與人的交互體驗(yàn),在全世界引發(fā)熱烈反響。
目前的大模型屬于生成式人工智能(AI Generated Contents,AIGC)范疇,主要指語(yǔ)言大模型,也包括計(jì)算機(jī)視覺(jué)(Computer Vision,CV)大模型和多模態(tài)(Multimodal)大模型。大模型的訓(xùn)練數(shù)據(jù)量、參數(shù)量、計(jì)算量顯著大于此前的人工智能模型,可實(shí)現(xiàn)在超高維度空間上對(duì)人類(lèi)全部知識(shí)的高度壓縮映射。
大模型基于海量數(shù)據(jù)訓(xùn)練形成基本的語(yǔ)言能力,并通過(guò)基于人工干預(yù)的模型調(diào)優(yōu),形成了包括對(duì)話能力、代碼生成能力在內(nèi)的一系列基礎(chǔ)能力。大模型普遍具有自動(dòng)形成推理結(jié)構(gòu)和分析邏輯、長(zhǎng)距離上下文一致、代碼生成和理解等支撐相對(duì)復(fù)雜任務(wù)的基礎(chǔ)能力。同時(shí),大模型還能夠理解基于自然語(yǔ)言的需求描述或示例,結(jié)合補(bǔ)充的業(yè)務(wù)信息知識(shí),實(shí)現(xiàn)基礎(chǔ)能力迅速向不同任務(wù)和場(chǎng)景遷移,有效解決人工智能技術(shù)在場(chǎng)景落地時(shí)研發(fā)成本高、數(shù)據(jù)不足、模型能力不穩(wěn)定且遷移性差等問(wèn)題。
大模型的上述突出能力也令其具有較大的工程應(yīng)用潛力?;谔崾驹~工程、強(qiáng)化學(xué)習(xí)、外部知識(shí)庫(kù)等技術(shù),大模型能迅速實(shí)現(xiàn)從基座模型能力向場(chǎng)景應(yīng)用落地轉(zhuǎn)化,模型的場(chǎng)景調(diào)優(yōu)成本很低甚至無(wú)須模型調(diào)優(yōu)。這不僅使得模型場(chǎng)景落地的研發(fā)成本和業(yè)務(wù)知識(shí)需求顯著降低,而且令模型場(chǎng)景落地的標(biāo)準(zhǔn)化、流程化水平以及相應(yīng)標(biāo)準(zhǔn)化工具的可用性顯著提高。
眾多科技企業(yè)正全力推進(jìn)行業(yè)大模型技術(shù)落地工作,打造通用的基座模型、通用的工具能力和標(biāo)準(zhǔn)化的行業(yè)智能應(yīng)用。建設(shè)服務(wù)專(zhuān)業(yè)領(lǐng)域的行業(yè)大模型,并深度賦能業(yè)務(wù),已成為眾多企業(yè)在人工智能技術(shù)領(lǐng)域的關(guān)鍵工作任務(wù)。
02
大模型技術(shù)在油氣行業(yè)應(yīng)用潛力巨大,但面臨應(yīng)用層面和工程層面的業(yè)務(wù)理解、數(shù)據(jù)打通等挑戰(zhàn)
目前,大模型的主要應(yīng)用形式包括聊天對(duì)話、智能寫(xiě)作、輔助編程、智能搜索、知識(shí)問(wèn)答等,主要應(yīng)用場(chǎng)景可分為通用(如經(jīng)營(yíng)管理、辦公)和專(zhuān)業(yè)(如能源、金融)兩類(lèi)。
人工智能大模型技術(shù)在助力油氣行業(yè)適應(yīng)市場(chǎng)變化、提升生產(chǎn)效率等方面前景廣闊,潛在的業(yè)務(wù)需求場(chǎng)景豐富。在勘探開(kāi)發(fā)領(lǐng)域,行業(yè)大模型可以幫助工程師快速分析地質(zhì)、儲(chǔ)層、油藏等復(fù)雜信息,為勘探技術(shù)方案、研究報(bào)告等專(zhuān)業(yè)文檔的編寫(xiě)提供輔助支持。在煉油化工領(lǐng)域,行業(yè)大模型可以針對(duì)化工研究中特定的物理和化學(xué)特性,智能化模擬組合全新的化工原料,幫助煉化企業(yè)產(chǎn)品向差異化、高端化的方向發(fā)展。在銷(xiāo)售等領(lǐng)域,行業(yè)大模型可以快速獲取和分析生產(chǎn)、市場(chǎng)等數(shù)據(jù),生成行業(yè)和市場(chǎng)分析研究報(bào)告,為企業(yè)管理決策提供依據(jù)。
與此同時(shí),油氣行業(yè)大模型技術(shù)落地,在應(yīng)用層面和工程層面分別存在一定的困難。
在應(yīng)用層面,一是場(chǎng)景洞察難。石油天然氣工業(yè)數(shù)智化場(chǎng)景覆蓋采集、分析、控制、呈現(xiàn)、決策等業(yè)務(wù)鏈。在實(shí)際場(chǎng)景應(yīng)用上,是否真正具備價(jià)值、如何實(shí)現(xiàn)可量化的商業(yè)價(jià)值評(píng)判,是技術(shù)、經(jīng)驗(yàn)、商業(yè)模式、交付能力、生態(tài)等多方面共同作用的結(jié)果,這導(dǎo)致洞察難度大、試錯(cuò)成本高。二是結(jié)論解釋難。生成式人工智能屬于典型的黑盒編解碼架構(gòu),推理預(yù)測(cè)過(guò)程不可解釋。同時(shí),大模型提供的數(shù)據(jù)服務(wù),存在生成幻覺(jué)、錯(cuò)誤引導(dǎo)等風(fēng)險(xiǎn),需要通過(guò)具有業(yè)務(wù)屬性的結(jié)果解釋來(lái)滿足終端用戶的理解與使用要求。
在工程層面,一是應(yīng)用構(gòu)建和集成難。企業(yè)現(xiàn)有業(yè)務(wù)信息系統(tǒng),均以流程驅(qū)動(dòng)為主、以數(shù)據(jù)和模型驅(qū)動(dòng)為輔。大模型與現(xiàn)有業(yè)務(wù)系統(tǒng)及流程對(duì)接難度大。此外,跨多個(gè)分布式系統(tǒng)帶來(lái)的組織、角色、權(quán)限統(tǒng)一管理與數(shù)據(jù)資產(chǎn)安全應(yīng)用問(wèn)題,給大模型應(yīng)用的嵌入帶來(lái)了不確定性。二是跨專(zhuān)業(yè)語(yǔ)言對(duì)齊難。垂直領(lǐng)域大模型涉及勘探、開(kāi)發(fā)、生產(chǎn)、營(yíng)銷(xiāo)、運(yùn)營(yíng)等多個(gè)不同專(zhuān)業(yè),跨專(zhuān)業(yè)間的術(shù)語(yǔ)、專(zhuān)業(yè)知識(shí)、業(yè)務(wù)模式等復(fù)雜體系急需統(tǒng)一模式進(jìn)行對(duì)齊。此外,對(duì)于同類(lèi)專(zhuān)業(yè)內(nèi)部,終端用戶的業(yè)務(wù)專(zhuān)業(yè)語(yǔ)言與開(kāi)發(fā)者的技術(shù)語(yǔ)言也同樣急需對(duì)齊。三是數(shù)據(jù)獲取難。能源工業(yè)數(shù)據(jù)資產(chǎn)多為私域數(shù)據(jù)資產(chǎn),存在數(shù)據(jù)獲取渠道和獲取可行性上的限制,數(shù)據(jù)的流通與共享存在一定困難。同時(shí),不同來(lái)源的數(shù)據(jù)資產(chǎn)涉及范圍廣、數(shù)量大、質(zhì)量不一致,需要完備的數(shù)據(jù)存儲(chǔ)、治理、傳輸、表征和應(yīng)用鏈路,以保證數(shù)據(jù)資產(chǎn)的全鏈路可靠。
03
加快大模型技術(shù)研究與應(yīng)用落地,建議重點(diǎn)關(guān)注掌握自主可控的大模型技術(shù),實(shí)現(xiàn)場(chǎng)景深化應(yīng)用
大模型技術(shù)在通用和油氣專(zhuān)業(yè)場(chǎng)景展現(xiàn)出傳統(tǒng)技術(shù)不可替代的價(jià)值,將為產(chǎn)業(yè)新舊動(dòng)能轉(zhuǎn)換和能源經(jīng)濟(jì)高質(zhì)量發(fā)展提供有力支撐。建議貼近油氣產(chǎn)業(yè)鏈價(jià)值增量,基于油氣工業(yè)理解和數(shù)據(jù)資產(chǎn)積累,建設(shè)油氣行業(yè)的一體化大模型平臺(tái)和場(chǎng)景大模型應(yīng)用,解決應(yīng)用組裝、場(chǎng)景嵌入、高價(jià)值內(nèi)容生成、復(fù)雜任務(wù)鏈路執(zhí)行、復(fù)雜決策輔助等系列難點(diǎn)問(wèn)題,以大模型智能體集群支撐業(yè)務(wù)模式重塑、生產(chǎn)效率提升和生產(chǎn)安全可控。
一方面,要培育自主可控的油氣行業(yè)大模型關(guān)鍵核心技術(shù)。
培育人工智能大模型關(guān)鍵核心技術(shù),目標(biāo)是掌握大語(yǔ)言模型數(shù)據(jù)集建設(shè)技術(shù),大模型分布式構(gòu)建、訓(xùn)練、調(diào)優(yōu)、推理技術(shù),以及與之相配套的開(kāi)發(fā)工具。具體包括:一是研究模型基礎(chǔ)技術(shù),具備源碼層面的大模型開(kāi)發(fā)能力;二是研發(fā)模型工程技術(shù)能力與工具鏈,具備部署及持續(xù)優(yōu)化千億參數(shù)級(jí)大模型的能力;三是試點(diǎn)通用大模型的技術(shù)落地,結(jié)合油氣行業(yè)真實(shí)業(yè)務(wù)需求實(shí)現(xiàn)大模型技術(shù)的應(yīng)用落地。
另一方面,要打造通用智能助手、行業(yè)知識(shí)服務(wù)、智能伙伴等三類(lèi)大模型應(yīng)用。
一是通用智能助手。優(yōu)先在基礎(chǔ)通用大模型(L0)上加載通用語(yǔ)料,結(jié)合提示詞(prompt)技術(shù),快速搭建并推廣員工日常辦公輔助AI工具,提升辦公效率,培育大模型應(yīng)用環(huán)境和文化。
二是行業(yè)(專(zhuān)業(yè))知識(shí)服務(wù)。依托行業(yè)大模型(L1)、專(zhuān)業(yè)大模型(L2),加載沉淀的行業(yè)和專(zhuān)業(yè)知識(shí),構(gòu)建行業(yè)和專(zhuān)業(yè)知識(shí)庫(kù),提供行業(yè)和專(zhuān)業(yè)知識(shí)服務(wù),為智能業(yè)務(wù)協(xié)同輔助奠定基礎(chǔ)。
三是智能伙伴。結(jié)合專(zhuān)業(yè)知識(shí)和AI智能體(Agent)技術(shù),打造輔助業(yè)務(wù)系統(tǒng)的智能助手(Copilot),實(shí)現(xiàn)智能化與當(dāng)前面向業(yè)務(wù)的數(shù)字化系統(tǒng)深度集成,并優(yōu)化甚至重構(gòu)再造現(xiàn)有業(yè)務(wù)流程,大幅提升企業(yè)的整體運(yùn)營(yíng)效率和響應(yīng)速度。