近日,在人工智能領(lǐng)域的權(quán)威學(xué)術(shù)評(píng)測(cè)——第八屆國(guó)際對(duì)話系統(tǒng)技術(shù)挑戰(zhàn)賽(DSTC-8)上,騰訊云小微技術(shù)團(tuán)隊(duì)在參與的三個(gè)賽道七項(xiàng)任務(wù)中,共獲得四項(xiàng)指標(biāo)世界第一、兩項(xiàng)指標(biāo)第二的優(yōu)秀成績(jī)。這個(gè)成績(jī)是騰訊云小微團(tuán)隊(duì)和騰訊智能平臺(tái)產(chǎn)品部多年來(lái)在自然語(yǔ)言對(duì)話領(lǐng)域的積極探索和深度積累的一個(gè)具體體現(xiàn)和印證。
應(yīng)對(duì)多個(gè)賽道挑戰(zhàn) 騰訊云小微展示NLP技術(shù)實(shí)力
DSTC對(duì)話系統(tǒng)技術(shù)挑戰(zhàn)賽被公認(rèn)為國(guó)際頂尖人工智能競(jìng)賽之一,創(chuàng)立至今已經(jīng)舉辦八屆。歷屆大賽中都有國(guó)際領(lǐng)先的大學(xué)和高科技公司的支持和參與。本屆大賽吸引了來(lái)自中科大、華為、滴滴、IBM等全球頂尖的大學(xué)、科技企業(yè)和人工智能研究機(jī)構(gòu)等多支隊(duì)伍參與競(jìng)賽,帶來(lái)了當(dāng)今人工智能領(lǐng)域的頂尖技術(shù)水平的展示和交流。
在本次比賽的四大賽道中,騰訊云小微參與了其中三組評(píng)測(cè)。首先是面向多領(lǐng)域端到端對(duì)話系統(tǒng)( Multidomain Task),該任務(wù)探索如何將已有的對(duì)話生成模型迅速遷移到一個(gè)數(shù)據(jù)量非常有限的新領(lǐng)域?qū)υ拡?chǎng)景,并達(dá)到期望的性能。本賽道中,騰訊云小微提出混合微調(diào)訓(xùn)練技術(shù),取得了自動(dòng)評(píng)測(cè)的第一名。
在賽道二端到端的問(wèn)答預(yù)測(cè)( NOESIS II: Predicting Responses Track) 上,本屆NOESIS競(jìng)賽與以往不同,除了傳統(tǒng)的“多輪對(duì)話回復(fù)選擇問(wèn)題”(Subtask1-包含兩個(gè)子任務(wù))之外,還增加了“基于聊天室(IRC)的回復(fù)選擇問(wèn)題”(Subtask2),以及“定位多輪對(duì)話中的問(wèn)題是否得到解決”的新任務(wù)(Subtask3), 難度較以往有所增加。
本賽道中騰訊云小微參加了四項(xiàng)子任務(wù)。上圖為騰訊云小微提出的對(duì)話回復(fù)選擇模型。在BERT模型基礎(chǔ)上分別增加了數(shù)據(jù)增強(qiáng)技術(shù),用來(lái)彌補(bǔ)特定領(lǐng)域的數(shù)據(jù)稀疏問(wèn)題;同時(shí)利用遷移學(xué)習(xí)技術(shù),將BERT模型從通用領(lǐng)域準(zhǔn)確的適配到指定的任務(wù)領(lǐng)域中;應(yīng)對(duì)句子級(jí)上下文建模方法,捕捉整體對(duì)話中各個(gè)部分之間的細(xì)微聯(lián)系,從而生成更準(zhǔn)確的回復(fù)。通過(guò)綜合以上多種NLP模型,騰訊云小微團(tuán)隊(duì)最終以較大領(lǐng)先優(yōu)勢(shì)獲得三項(xiàng)第一和一項(xiàng)第二的成績(jī)。在多輪人機(jī)對(duì)話任務(wù)中,騰訊云小微準(zhǔn)確率達(dá)到97.9%,代表了AI機(jī)器人回復(fù)能力的新突破。在本屆DSTC新增的IRC聊天室對(duì)話的任務(wù)中,騰訊云小微的準(zhǔn)確率達(dá)到95.7%,凸顯了在行業(yè)中的領(lǐng)先技術(shù)水平。
在對(duì)話狀態(tài)追蹤任務(wù) (Schema-Guided Dialogue State Tracking Track)方面,與以往的狀態(tài)追蹤任務(wù)不同,該任務(wù)是Google提出的一個(gè)全新的任務(wù),旨在推進(jìn)零樣本(Zero-Shot)對(duì)話狀態(tài)追蹤技術(shù)的研究,難度較大。本賽道中,騰訊團(tuán)隊(duì)提出了一個(gè)基于預(yù)訓(xùn)練BERT模型的領(lǐng)域無(wú)關(guān)的零樣本學(xué)習(xí)系統(tǒng),可以有效捕捉意圖槽位的自然語(yǔ)言描述和對(duì)話上下文的語(yǔ)義聯(lián)系,取得了總成績(jī)第二名。
結(jié)合豐富應(yīng)用場(chǎng)景 AI語(yǔ)音技術(shù)不斷進(jìn)步
對(duì)話系統(tǒng)技術(shù)可以理解為AI模擬人的對(duì)話技術(shù),很多復(fù)雜的交流場(chǎng)景中,AI仍在不斷進(jìn)化,以模擬出更貼近人與人之間的對(duì)話模式。隨著AI技術(shù)從研究逐步走向應(yīng)用,人們對(duì)于AI助手提出了更高的要求。作為代表了全球高水平技術(shù)的DSTC競(jìng)賽,也根據(jù)實(shí)際應(yīng)用場(chǎng)景設(shè)置比賽項(xiàng)目,并不斷提升比賽的挑戰(zhàn)性。
對(duì)話機(jī)器人已經(jīng)在智能硬件、智能客服、智能外呼等領(lǐng)域有了一定普及度的應(yīng)用,但是在人機(jī)對(duì)話的效率、準(zhǔn)確性和人性化等方面,科學(xué)家們?nèi)栽诔掷m(xù)的探索和提高。從不斷提高的挑戰(zhàn)成績(jī)也能看出,新技術(shù)正在努力讓AI助手更好的理解人類(lèi)、服務(wù)人類(lèi)。
例如在客服機(jī)器人的場(chǎng)景中,如何通過(guò)連續(xù)性對(duì)話獲取用戶信息輸入,給出更快速準(zhǔn)確的響應(yīng);如何在任務(wù)型對(duì)話場(chǎng)景中支持反問(wèn)和打斷,實(shí)現(xiàn)自動(dòng)語(yǔ)義理解和糾錯(cuò);如何在跨領(lǐng)域知識(shí)場(chǎng)景下快速遷移機(jī)器人的能力,能幫助不同行業(yè)的合作伙伴快速搭建AI助手的服務(wù)能力;如何快速學(xué)習(xí)和抽取各領(lǐng)域的知識(shí)以高效率低成本的建設(shè)行業(yè)知識(shí)庫(kù)等。
騰訊云小微AI助手 助力各行業(yè)智慧化升級(jí)
騰訊智能平臺(tái)產(chǎn)品部NLP技術(shù)團(tuán)隊(duì)專注于AI對(duì)話領(lǐng)域的前沿探索及應(yīng)用研究,并發(fā)揮自身的技術(shù)積累和生態(tài)連接能力,與各行各業(yè)的業(yè)務(wù)場(chǎng)景相結(jié)合,提供騰訊云小微AI應(yīng)用解決方案。結(jié)合騰訊云平臺(tái)豐富的內(nèi)容和服務(wù)資源,騰訊云小微已經(jīng)在車(chē)載語(yǔ)音助手、智能機(jī)器人、智能家居產(chǎn)品、景區(qū)智能導(dǎo)覽、政務(wù)在線服務(wù)機(jī)器人、AI助教等領(lǐng)域落地,截止目前激活數(shù)已經(jīng)過(guò)億。
騰訊云小微攜手騰訊云和生態(tài)合作伙伴廣泛落地
在教育、公共服務(wù)、泛互聯(lián)網(wǎng)服務(wù)、文旅等重點(diǎn)領(lǐng)域, 騰訊云小微AI語(yǔ)音助手仍在不斷的提升技術(shù)能力,積累行業(yè)知識(shí)理解能力,幫助行業(yè)客戶快速打造逼真的對(duì)話體驗(yàn)。騰訊云小微期待為教育的公平化、信息化升級(jí)提供技術(shù)助力,助力企業(yè)和政府提升生產(chǎn)力和服務(wù)效率,成為各行業(yè)智能化升級(jí)的數(shù)字化助手。
免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自其它媒體的文章,目的在于弘揚(yáng)科技創(chuàng)新精神,傳遞更多科技創(chuàng)新信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),在此我們謹(jǐn)向原作者和原媒體致以崇高敬意。如果您認(rèn)為本站文章侵犯了您的版權(quán),請(qǐng)與我們聯(lián)系,我們將第一時(shí)間刪除。