松山湖材料實(shí)驗(yàn)室的自動(dòng)化平臺(tái)。
編者按:
當(dāng)“世界工廠”遇上人工智能,當(dāng)傳統(tǒng)車間走向數(shù)據(jù)云端,有“隱形冠軍”續(xù)寫傳奇,也有新銳力量重塑產(chǎn)業(yè),還有中小企業(yè)在全球市場中突圍。以它們?yōu)榇翱冢覀冇^察東莞企業(yè)如何以創(chuàng)新為刃,開辟產(chǎn)業(yè)升級(jí)的新路徑。
即日起,南方日?qǐng)?bào)、南方+推出《莞企新勢(shì)》欄目。欄目將講述莞企之間的新鮮事,關(guān)注莞企發(fā)展的新趨勢(shì),敬請(qǐng)垂注。
近期,通用大語言模型DeepSeek的橫空出世,標(biāo)志著人類在人工智能領(lǐng)域前進(jìn)一大步。未來,智能助手和自動(dòng)化工具將深刻改變?nèi)藗兊纳詈凸ぷ鞣绞健?/p>
得益于通用AI模型的蓬勃發(fā)展,近日,松山湖材料實(shí)驗(yàn)室發(fā)布了一件材料科學(xué)領(lǐng)域的重磅AI工具:MatChat AI智能體。它是一款專注于材料科學(xué)領(lǐng)域的智能問答引擎,基于大語言模型(LLM)與增強(qiáng)搜索技術(shù)(RAG),提取了超過28萬篇專業(yè)論文構(gòu)建知識(shí)庫。
這款被稱為“材料科學(xué)界的DeepSeek”的AI平臺(tái),憑借其專業(yè)性和精準(zhǔn)性迅速引發(fā)行業(yè)關(guān)注。觀察人士認(rèn)為,MatChat的發(fā)布不僅是技術(shù)突破,更標(biāo)志著垂類科學(xué)研發(fā)范式的轉(zhuǎn)變——從經(jīng)驗(yàn)驅(qū)動(dòng)轉(zhuǎn)向“數(shù)據(jù)+AI驅(qū)動(dòng)”。
當(dāng)AI能夠?qū)⒑A课墨I(xiàn)轉(zhuǎn)化為可操作的知識(shí),并鏈接實(shí)驗(yàn)與產(chǎn)業(yè)時(shí),垂類科學(xué)的創(chuàng)新速度將不再受限于人類個(gè)體的認(rèn)知邊界。對(duì)于東莞這座“制造業(yè)名城”而言,MatChat或是其從制造躍向“智造”的關(guān)鍵拼圖。
撰文:南方日?qǐng)?bào)記者 唐卓
策劃:戴雙城
從“幻覺回答”到精準(zhǔn)溯源
隨著DeepSeek的爆火,不少網(wǎng)友發(fā)現(xiàn),當(dāng)使用R1模式時(shí),大模型總是在“一本正經(jīng)地胡說八道”。這并非錯(cuò)覺,在Vectara HHEM人工智能幻覺測試中,DeepSeek—R1顯示出14.3%的幻覺率。
何謂“幻覺”?幻覺的本質(zhì)是補(bǔ)白,是腦補(bǔ)。通俗來說,就是AI“胡編亂造”的信息,即AI在回答用戶問題時(shí),對(duì)于不知道正確答案的問題,不是明確告知用戶“我不知道”,而是根據(jù)已有的知識(shí)編出一個(gè)聽起來像是對(duì)的答案,但實(shí)際上是假的、錯(cuò)誤的,甚至完全不存在的信息。
對(duì)于普通咨詢而言,這種腦補(bǔ)無傷大雅,甚至還饒有趣味。但對(duì)于科學(xué)研究來說,“幻覺”是最大的敵人。中國科學(xué)院物理研究所研究員、博士生導(dǎo)師劉淼直言:“科學(xué)領(lǐng)域需要的是真實(shí)、可驗(yàn)證的知識(shí),而非想象力?!?/p>
正如劉淼所言,MatChat AI基于大語言模型(LLM)與增強(qiáng)搜索技術(shù)(RAG),從28萬篇材料科學(xué)、物理、化學(xué)論文中提取知識(shí),構(gòu)建了一個(gè)垂直領(lǐng)域的知識(shí)庫。用戶通過對(duì)話即可獲取高度結(jié)構(gòu)化的學(xué)術(shù)信息,并附有參考文獻(xiàn)和原文鏈接,徹底解決了通用模型中常見的“虛構(gòu)答案”問題。
例如,當(dāng)用戶詢問“鈣鈦礦光伏材料的產(chǎn)業(yè)應(yīng)用”時(shí),MatChat不僅能總結(jié)關(guān)鍵信息,還能精準(zhǔn)定位到相關(guān)論文的段落與圖表,甚至預(yù)測合成路徑。
這種“精準(zhǔn)溯源”能力,讓MatChat迅速吸引了4700多名用戶,上線一周即完成27萬次問答,成為科研工作者的智能文獻(xiàn)助手。未來,松山湖材料實(shí)驗(yàn)室將把Atomly材料科學(xué)數(shù)據(jù)庫平臺(tái)、“機(jī)器人科學(xué)家”與MatChat結(jié)合起來,掀起一場垂類科學(xué)領(lǐng)域“AI+材料”的范式革命。
厚積薄發(fā)的“奇襲”
100多年前,當(dāng)泰坦尼克號(hào)航行在大西洋海面上時(shí),出現(xiàn)在船員望遠(yuǎn)鏡中的僅是冰山的一角。而船員們看不見的,是冰山之下規(guī)模龐大的隱藏部分。
MatChat的發(fā)布看似是一次技術(shù)“奇襲”,但其根基卻深埋在松山湖實(shí)驗(yàn)室多年的數(shù)據(jù)積累中。
早在MatChat誕生前,材料實(shí)驗(yàn)室已建成全球領(lǐng)先的材料數(shù)據(jù)庫Atomly.net,收錄了35萬種材料的晶體結(jié)構(gòu)、熱力學(xué)穩(wěn)定性等計(jì)算數(shù)據(jù)。值得一提的是,這些數(shù)據(jù)通過密度泛函理論等物理模型生成,精度接近實(shí)驗(yàn)驗(yàn)證結(jié)果,可以直接作用于企業(yè)新材料的研發(fā)。
劉淼如此描述這一技術(shù)迭代:“我們相當(dāng)于用算力換數(shù)據(jù),再用數(shù)據(jù)訓(xùn)練AI模型——這是左腳與右腳的交替前進(jìn)?!?/p>
劉淼還介紹,MatChat的研發(fā)并非孤立項(xiàng)目,而是材料實(shí)驗(yàn)室“AI+材料”生態(tài)的一部分。在人員配備方面,松山湖材料實(shí)驗(yàn)室整合了中國科學(xué)院多個(gè)院所的力量,形成了跨學(xué)科的技術(shù)網(wǎng)絡(luò);在平臺(tái)建設(shè)方面,材料實(shí)驗(yàn)室把Atomly材料科學(xué)數(shù)據(jù)庫平臺(tái)、“機(jī)器人科學(xué)家”與MatChat結(jié)合起來,實(shí)現(xiàn)從數(shù)據(jù)預(yù)測到實(shí)驗(yàn)驗(yàn)證的閉環(huán)。
值得一提的是,“冰山下的支撐”既包含技術(shù)生態(tài)的構(gòu)建,也暗含城市資源與制度創(chuàng)新的深層互動(dòng)。
一方面,東莞的制造業(yè)基礎(chǔ)為材料實(shí)驗(yàn)室提供了試驗(yàn)場。2023年,實(shí)驗(yàn)室四大公共技術(shù)平臺(tái)服務(wù)企業(yè)超400家,創(chuàng)新樣板工廠孵化企業(yè)35家,其中靶材、新能源等項(xiàng)目已落地本地產(chǎn)業(yè)鏈,為源頭創(chuàng)新提供大量生動(dòng)熱辣的“材料命題”。
另一方面,東莞積極探索科技體制改革,鼓勵(lì)松山湖材料實(shí)驗(yàn)室將科技成果轉(zhuǎn)化收益的80%分配給科學(xué)家團(tuán)隊(duì),這種“風(fēng)險(xiǎn)共擔(dān)、收益共享”的模式,讓無數(shù)優(yōu)秀科技人才魚躍進(jìn)莞,劉淼介紹,MatChat項(xiàng)目中的代碼構(gòu)建人員正是來自一線城市的知名“大廠”。
不難發(fā)現(xiàn),“技術(shù)+城市”的雙重稟賦,正在重構(gòu)垂類科學(xué)創(chuàng)新范式。從單點(diǎn)突破轉(zhuǎn)向系統(tǒng)能力競爭,而東莞有望成為中國版“橡樹嶺”的候選者。
從“兩張皮”到產(chǎn)業(yè)閉環(huán)
在訪談中,劉淼描述了傳統(tǒng)的材料研發(fā)模式:假如有一名研發(fā)人員在研究一種新型材料,他需要3—5個(gè)月時(shí)間來檢索了解文獻(xiàn);然后再驗(yàn)證這些材料中哪種最穩(wěn)定,進(jìn)一步縮小研究范圍;最后進(jìn)入打樣環(huán)節(jié),通過反復(fù)測試樣本后,最終得到配適的材料。
在這一過程中,研發(fā)人員需耗費(fèi)數(shù)月閱讀文獻(xiàn)、設(shè)計(jì)實(shí)驗(yàn),而企業(yè)則苦于無法快速獲取可信的科學(xué)支持。實(shí)驗(yàn)室和產(chǎn)線之間,似乎總橫亙著一條難以跨越的天塹,這便是人們常說的科技與產(chǎn)業(yè)“兩張皮”的問題。
而MatChat的終極目標(biāo),是致力于解決科研與產(chǎn)業(yè)脫節(jié)的“兩張皮”問題。
如何解決?首先是AI帶來的“知識(shí)平權(quán)”。企業(yè)研發(fā)人員可直接用自然語言提問,例如“磷酸鐵鋰電池的優(yōu)化方向”,AI系統(tǒng)將快速提供文獻(xiàn)綜述與數(shù)據(jù)支撐,降低專業(yè)門檻。
其次,材料實(shí)驗(yàn)室將數(shù)據(jù)庫、MatChat與“機(jī)器人科學(xué)家”整合為“材料CRO(合同研發(fā)組織)”模式。用戶可在線提交需求,由機(jī)器人完成合成與測試,形成“數(shù)據(jù)—模擬—實(shí)驗(yàn)”的工業(yè)化流程。這一流程帶來的直接影響是,企業(yè)不再受限于自有研發(fā)能力,而可以與科研院所、新型研發(fā)機(jī)構(gòu)“無縫銜接”,資源共享,從而提升其源頭創(chuàng)新能力。
由于新的理論、方法、技術(shù)或觀念的出現(xiàn),導(dǎo)致原有的研究范式或?qū)嵺`模式發(fā)生根本性變革的過程,被稱為“范式革命”。當(dāng)通用大語言模型打響第一槍后,眾多以其為“養(yǎng)料”的垂類大模型將層出不窮,深度改變?nèi)藗兊纳a(chǎn)和生活方式。在材料領(lǐng)域,“AI驅(qū)動(dòng)的研發(fā)”模式正成為新能源、半導(dǎo)體行業(yè)的效率引擎,未來,我們或?qū)⑦M(jìn)入一個(gè)“高速創(chuàng)新”的時(shí)代。
免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自其它媒體的文章及圖片,目的在于弘揚(yáng)科技創(chuàng)新精神,傳遞更多科技創(chuàng)新信息,宣傳國家科技政策,展示國家科技形象,增強(qiáng)國家科技軟實(shí)力,參與國際科技輿論競爭,推廣科技企業(yè)品牌和產(chǎn)品,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),在此我們謹(jǐn)向原作者和原媒體致以崇高敬意。如果您認(rèn)為本網(wǎng)文章及圖片侵犯了您的版權(quán),請(qǐng)與我們聯(lián)系,我們將第一時(shí)間刪除。