中國企業(yè)在全球機器閱讀理解水平測試折桂

據(jù)微軟官方公布消息,最新的全球機器閱讀理解標準水平測試(MSMARCO)中,中國企業(yè)“猿輔導”名列第一,其數(shù)據(jù)模型在閱讀理解能力上超過了人類的平均水平。

 

圖片默認標題_fororder_猿輔導

 

“猿輔導”標志

 

MSMARCO是全球人工智能領(lǐng)域行業(yè)中,公認的機器閱讀理解標準水平測試,也是該領(lǐng)域的頂級賽事。賽事舉辦目標是創(chuàng)造出能夠像人類一樣思考的機器,吸引世界頂尖科技公司的人工智能研究團隊參與。微軟公司從搜索引擎中抽?。保叭f個問題,然后由人類和參賽團隊數(shù)據(jù)模型進行答題。

 

參賽的“猿輔導”是國內(nèi)一家在線教育創(chuàng)業(yè)公司。此次該企業(yè)研究團隊的MARS數(shù)據(jù)模型,答題在兩項官方評測指標上分別得分49.72、48.02,位列參賽團隊榜首,且超越人類47、46的基準水平。百度NLP團隊、微軟AI研究團隊分列二、三名。

 

“猿輔導”研究團隊武漢分部負責人柳景明表示,猿輔導此次提交的MARS模型,采用層疊式的注意力機制在多候選文檔,采樣出多個候選答案區(qū)域,并在此基礎(chǔ)上使用交叉投票模型,優(yōu)化最終的答案,實現(xiàn)機器找出的答案比普通人找的更準確。

 

微軟全球機器閱讀理解標準水平測試項目負責人表示,人工智能得分超過人類,將意味著人工智能在探索和學習人類知識時,將能夠更快、更有效地獲取信息,“如果能讓機器像人類一樣閱讀和理解文檔,將為所有可能的情形開啟大門。”