行業動態

機器閱讀理解：人工智能技術的重要分支之一

文字：[大][中][小] 手機頁面二維碼

2021/6/25 瀏覽次數：

一鍵分享

在線客服

　　機器閱讀理解(英文Machine Reading Comprehension，簡稱MRC)是近期自然語言處理領域的研究熱點之一，更是人工智能在處理和理解人類語言進程中的一個目標。得益于深度學習技術和大規模標注數據集的發展，用端到端的神經網絡來解決閱讀理解任務取得了長足的進步。

　　人類可以輕而易舉地閱讀理解自己的母語，而機器卻難于閱讀理解自然語言。要想讓機器閱讀理解自然語言，就需要把自然語言轉化成它可以用來讀取、存儲、計算的數值形式。當若干自然語言被轉換為數值之后，機器通過在這些數值之上的一系列運算來確定它們之間的關系，再根據一個全集之中個體之間的相互關系，來確定某個個體在整體（全集）中的位置。

　　機器閱讀理解是一種利用算法使計算機理解文章語義并回答相關問題的技術。由于文章和問題均采用自然語言的形式，因此機器閱讀理解屬于自然語言處理的范疇。近年來，隨著機器學習(Machine Learning)，特別是深度學習的飛速發展，機器閱讀理解研究有了長足的進步，并在實際應用中嶄露頭角。

　　隨著機器閱讀理解技術的發展，閱讀理解任務也在不斷升級。從早期的“完形填空形式”，發展到基于維基百科的“單文檔閱讀理解”，如以斯坦福大學設計的SQuAD為數據集的任務；并進一步升級至基于web（網頁）數據的“多文檔閱讀理解”，這一形式的典型代表是以微軟公司MS-MARCO、百度公司DuReader為數據集的任務。

　　目前，針對不同的閱讀理解任務，研究人員已經設計出多種模型，并取得初步成效。然而在多文檔閱讀理解任務中，由于與問題相關的文檔很多，帶來的歧義也更多，由此可能導致閱讀理解模型定位錯誤的答案。面對這些問題，人類的思考模式通常為：先找到多個候選答案，通過對比多個候選答案的內容，選出答案。

　　早期的閱讀理解模型大多基于檢索技術，即根據問題在文章中進行搜索，找到相關的語句作為答案。但是，信息檢索主要依賴關鍵詞匹配，而在很多情況下，單純依靠問題和文章片段的文字匹配找到的答案與問題并不相關。隨著深度學習的發展，機器閱讀理解進入了神經網絡時代。相關技術的進步給模型的效率和質量都帶來了很大的提升。

返回上一步: 打印此頁

上一個：AGV助力物流行業持續提速
下一個：互聯時代，智慧城市建設日益提速

国精品无码一区二区三区左线蜜桃_国产成人精品一区二区三区视频_亚洲图片,乱伦性爱,卡通动漫_国产乱子伦

行業動態

機器閱讀理解：人工智能技術的重要分支之一