01
大模型技術(shù)的性能和遷移性顯著超越此前模型,具備支持行業(yè)智能化的巨大潛力
自ChatGPT模型于2022年底問世以來,大模型以其強大的多輪對話能力、多場景多任務(wù)適應(yīng)能力和與人的交互體驗,在全世界引發(fā)熱烈反響。
目前的大模型屬于生成式人工智能(AI Generated Contents,AIGC)范疇,主要指語言大模型,也包括計算機視覺(Computer Vision,CV)大模型和多模態(tài)(Multimodal)大模型。大模型的訓(xùn)練數(shù)據(jù)量、參數(shù)量、計算量顯著大于此前的人工智能模型,可實現(xiàn)在超高維度空間上對人類全部知識的高度壓縮映射。
大模型基于海量數(shù)據(jù)訓(xùn)練形成基本的語言能力,并通過基于人工干預(yù)的模型調(diào)優(yōu),形成了包括對話能力、代碼生成能力在內(nèi)的一系列基礎(chǔ)能力。大模型普遍具有自動形成推理結(jié)構(gòu)和分析邏輯、長距離上下文一致、代碼生成和理解等支撐相對復(fù)雜任務(wù)的基礎(chǔ)能力。同時,大模型還能夠理解基于自然語言的需求描述或示例,結(jié)合補充的業(yè)務(wù)信息知識,實現(xiàn)基礎(chǔ)能力迅速向不同任務(wù)和場景遷移,有效解決人工智能技術(shù)在場景落地時研發(fā)成本高、數(shù)據(jù)不足、模型能力不穩(wěn)定且遷移性差等問題。
大模型的上述突出能力也令其具有較大的工程應(yīng)用潛力。基于提示詞工程、強化學(xué)習(xí)、外部知識庫等技術(shù),大模型能迅速實現(xiàn)從基座模型能力向場景應(yīng)用落地轉(zhuǎn)化,模型的場景調(diào)優(yōu)成本很低甚至無須模型調(diào)優(yōu)。這不僅使得模型場景落地的研發(fā)成本和業(yè)務(wù)知識需求顯著降低,而且令模型場景落地的標(biāo)準(zhǔn)化、流程化水平以及相應(yīng)標(biāo)準(zhǔn)化工具的可用性顯著提高。
眾多科技企業(yè)正全力推進行業(yè)大模型技術(shù)落地工作,打造通用的基座模型、通用的工具能力和標(biāo)準(zhǔn)化的行業(yè)智能應(yīng)用。建設(shè)服務(wù)專業(yè)領(lǐng)域的行業(yè)大模型,并深度賦能業(yè)務(wù),已成為眾多企業(yè)在人工智能技術(shù)領(lǐng)域的關(guān)鍵工作任務(wù)。
02
大模型技術(shù)在油氣行業(yè)應(yīng)用潛力巨大,但面臨應(yīng)用層面和工程層面的業(yè)務(wù)理解、數(shù)據(jù)打通等挑戰(zhàn)
目前,大模型的主要應(yīng)用形式包括聊天對話、智能寫作、輔助編程、智能搜索、知識問答等,主要應(yīng)用場景可分為通用(如經(jīng)營管理、辦公)和專業(yè)(如能源、金融)兩類。
人工智能大模型技術(shù)在助力油氣行業(yè)適應(yīng)市場變化、提升生產(chǎn)效率等方面前景廣闊,潛在的業(yè)務(wù)需求場景豐富。在勘探開發(fā)領(lǐng)域,行業(yè)大模型可以幫助工程師快速分析地質(zhì)、儲層、油藏等復(fù)雜信息,為勘探技術(shù)方案、研究報告等專業(yè)文檔的編寫提供輔助支持。在煉油化工領(lǐng)域,行業(yè)大模型可以針對化工研究中特定的物理和化學(xué)特性,智能化模擬組合全新的化工原料,幫助煉化企業(yè)產(chǎn)品向差異化、高端化的方向發(fā)展。在銷售等領(lǐng)域,行業(yè)大模型可以快速獲取和分析生產(chǎn)、市場等數(shù)據(jù),生成行業(yè)和市場分析研究報告,為企業(yè)管理決策提供依據(jù)。
與此同時,油氣行業(yè)大模型技術(shù)落地,在應(yīng)用層面和工程層面分別存在一定的困難。
在應(yīng)用層面,一是場景洞察難。石油天然氣工業(yè)數(shù)智化場景覆蓋采集、分析、控制、呈現(xiàn)、決策等業(yè)務(wù)鏈。在實際場景應(yīng)用上,是否真正具備價值、如何實現(xiàn)可量化的商業(yè)價值評判,是技術(shù)、經(jīng)驗、商業(yè)模式、交付能力、生態(tài)等多方面共同作用的結(jié)果,這導(dǎo)致洞察難度大、試錯成本高。二是結(jié)論解釋難。生成式人工智能屬于典型的黑盒編解碼架構(gòu),推理預(yù)測過程不可解釋。同時,大模型提供的數(shù)據(jù)服務(wù),存在生成幻覺、錯誤引導(dǎo)等風(fēng)險,需要通過具有業(yè)務(wù)屬性的結(jié)果解釋來滿足終端用戶的理解與使用要求。
在工程層面,一是應(yīng)用構(gòu)建和集成難。企業(yè)現(xiàn)有業(yè)務(wù)信息系統(tǒng),均以流程驅(qū)動為主、以數(shù)據(jù)和模型驅(qū)動為輔。大模型與現(xiàn)有業(yè)務(wù)系統(tǒng)及流程對接難度大。此外,跨多個分布式系統(tǒng)帶來的組織、角色、權(quán)限統(tǒng)一管理與數(shù)據(jù)資產(chǎn)安全應(yīng)用問題,給大模型應(yīng)用的嵌入帶來了不確定性。二是跨專業(yè)語言對齊難。垂直領(lǐng)域大模型涉及勘探、開發(fā)、生產(chǎn)、營銷、運營等多個不同專業(yè),跨專業(yè)間的術(shù)語、專業(yè)知識、業(yè)務(wù)模式等復(fù)雜體系急需統(tǒng)一模式進行對齊。此外,對于同類專業(yè)內(nèi)部,終端用戶的業(yè)務(wù)專業(yè)語言與開發(fā)者的技術(shù)語言也同樣急需對齊。三是數(shù)據(jù)獲取難。能源工業(yè)數(shù)據(jù)資產(chǎn)多為私域數(shù)據(jù)資產(chǎn),存在數(shù)據(jù)獲取渠道和獲取可行性上的限制,數(shù)據(jù)的流通與共享存在一定困難。同時,不同來源的數(shù)據(jù)資產(chǎn)涉及范圍廣、數(shù)量大、質(zhì)量不一致,需要完備的數(shù)據(jù)存儲、治理、傳輸、表征和應(yīng)用鏈路,以保證數(shù)據(jù)資產(chǎn)的全鏈路可靠。
03
加快大模型技術(shù)研究與應(yīng)用落地,建議重點關(guān)注掌握自主可控的大模型技術(shù),實現(xiàn)場景深化應(yīng)用
大模型技術(shù)在通用和油氣專業(yè)場景展現(xiàn)出傳統(tǒng)技術(shù)不可替代的價值,將為產(chǎn)業(yè)新舊動能轉(zhuǎn)換和能源經(jīng)濟高質(zhì)量發(fā)展提供有力支撐。建議貼近油氣產(chǎn)業(yè)鏈價值增量,基于油氣工業(yè)理解和數(shù)據(jù)資產(chǎn)積累,建設(shè)油氣行業(yè)的一體化大模型平臺和場景大模型應(yīng)用,解決應(yīng)用組裝、場景嵌入、高價值內(nèi)容生成、復(fù)雜任務(wù)鏈路執(zhí)行、復(fù)雜決策輔助等系列難點問題,以大模型智能體集群支撐業(yè)務(wù)模式重塑、生產(chǎn)效率提升和生產(chǎn)安全可控。
一方面,要培育自主可控的油氣行業(yè)大模型關(guān)鍵核心技術(shù)。
培育人工智能大模型關(guān)鍵核心技術(shù),目標(biāo)是掌握大語言模型數(shù)據(jù)集建設(shè)技術(shù),大模型分布式構(gòu)建、訓(xùn)練、調(diào)優(yōu)、推理技術(shù),以及與之相配套的開發(fā)工具。具體包括:一是研究模型基礎(chǔ)技術(shù),具備源碼層面的大模型開發(fā)能力;二是研發(fā)模型工程技術(shù)能力與工具鏈,具備部署及持續(xù)優(yōu)化千億參數(shù)級大模型的能力;三是試點通用大模型的技術(shù)落地,結(jié)合油氣行業(yè)真實業(yè)務(wù)需求實現(xiàn)大模型技術(shù)的應(yīng)用落地。
另一方面,要打造通用智能助手、行業(yè)知識服務(wù)、智能伙伴等三類大模型應(yīng)用。
一是通用智能助手。優(yōu)先在基礎(chǔ)通用大模型(L0)上加載通用語料,結(jié)合提示詞(prompt)技術(shù),快速搭建并推廣員工日常辦公輔助AI工具,提升辦公效率,培育大模型應(yīng)用環(huán)境和文化。
二是行業(yè)(專業(yè))知識服務(wù)。依托行業(yè)大模型(L1)、專業(yè)大模型(L2),加載沉淀的行業(yè)和專業(yè)知識,構(gòu)建行業(yè)和專業(yè)知識庫,提供行業(yè)和專業(yè)知識服務(wù),為智能業(yè)務(wù)協(xié)同輔助奠定基礎(chǔ)。
三是智能伙伴。結(jié)合專業(yè)知識和AI智能體(Agent)技術(shù),打造輔助業(yè)務(wù)系統(tǒng)的智能助手(Copilot),實現(xiàn)智能化與當(dāng)前面向業(yè)務(wù)的數(shù)字化系統(tǒng)深度集成,并優(yōu)化甚至重構(gòu)再造現(xiàn)有業(yè)務(wù)流程,大幅提升企業(yè)的整體運營效率和響應(yīng)速度。