更多
企業動態
-
2021-4-232021年4月23日天長市人大一行參觀調研
-
2021-4-12021.4.1安徽省政協副主席李和平現場考察
-
2021-3-302021.3.30國務院特殊津貼專家楊學軍博導現場指導
行業動態
機器閱讀理解(英文Machine Reading Comprehension,簡稱MRC)是近期自然語言處理領域的研究熱點之一,更是人工智能在處理和理解人類語言進程中的一個目標。得益于深度學習技術和大規模標注數據集的發展,用端到端的神經網絡來解決閱讀理解任務取得了長足的進步。
人類可以輕而易舉地閱讀理解自己的母語,而機器卻難于閱讀理解自然語言。要想讓機器閱讀理解自然語言,就需要把自然語言轉化成它可以用來讀取、存儲、計算的數值形式。當若干自然語言被轉換為數值之后,機器通過在這些數值之上的一系列運算來確定它們之間的關系,再根據一個全集之中個體之間的相互關系,來確定某個個體在整體(全集)中的位置。
機器閱讀理解是一種利用算法使計算機理解文章語義并回答相關問題的技術。由于文章和問題均采用自然語言的形式,因此機器閱讀理解屬于自然語言處理的范疇。近年來,隨著機器學習(Machine Learning),特別是深度學習的飛速發展,機器閱讀理解研究有了長足的進步,并在實際應用中嶄露頭角。
隨著機器閱讀理解技術的發展,閱讀理解任務也在不斷升級。從早期的“完形填空形式”,發展到基于維基百科的“單文檔閱讀理解”,如以斯坦福大學設計的SQuAD為數據集的任務;并進一步升級至基于web(網頁)數據的“多文檔閱讀理解”,這一形式的典型代表是以微軟公司MS-MARCO、百度公司DuReader為數據集的任務。
目前,針對不同的閱讀理解任務,研究人員已經設計出多種模型,并取得初步成效。然而在多文檔閱讀理解任務中,由于與問題相關的文檔很多,帶來的歧義也更多,由此可能導致閱讀理解模型定位錯誤的答案。面對這些問題,人類的思考模式通常為:先找到多個候選答案,通過對比多個候選答案的內容,選出答案。
早期的閱讀理解模型大多基于檢索技術,即根據問題在文章中進行搜索,找到相關的語句作為答案。但是,信息檢索主要依賴關鍵詞匹配,而在很多情況下,單純依靠問題和文章片段的文字匹配找到的答案與問題并不相關。隨著深度學習的發展,機器閱讀理解進入了神經網絡時代。相關技術的進步給模型的效率和質量都帶來了很大的提升。
人類可以輕而易舉地閱讀理解自己的母語,而機器卻難于閱讀理解自然語言。要想讓機器閱讀理解自然語言,就需要把自然語言轉化成它可以用來讀取、存儲、計算的數值形式。當若干自然語言被轉換為數值之后,機器通過在這些數值之上的一系列運算來確定它們之間的關系,再根據一個全集之中個體之間的相互關系,來確定某個個體在整體(全集)中的位置。
機器閱讀理解是一種利用算法使計算機理解文章語義并回答相關問題的技術。由于文章和問題均采用自然語言的形式,因此機器閱讀理解屬于自然語言處理的范疇。近年來,隨著機器學習(Machine Learning),特別是深度學習的飛速發展,機器閱讀理解研究有了長足的進步,并在實際應用中嶄露頭角。
隨著機器閱讀理解技術的發展,閱讀理解任務也在不斷升級。從早期的“完形填空形式”,發展到基于維基百科的“單文檔閱讀理解”,如以斯坦福大學設計的SQuAD為數據集的任務;并進一步升級至基于web(網頁)數據的“多文檔閱讀理解”,這一形式的典型代表是以微軟公司MS-MARCO、百度公司DuReader為數據集的任務。
目前,針對不同的閱讀理解任務,研究人員已經設計出多種模型,并取得初步成效。然而在多文檔閱讀理解任務中,由于與問題相關的文檔很多,帶來的歧義也更多,由此可能導致閱讀理解模型定位錯誤的答案。面對這些問題,人類的思考模式通常為:先找到多個候選答案,通過對比多個候選答案的內容,選出答案。
早期的閱讀理解模型大多基于檢索技術,即根據問題在文章中進行搜索,找到相關的語句作為答案。但是,信息檢索主要依賴關鍵詞匹配,而在很多情況下,單純依靠問題和文章片段的文字匹配找到的答案與問題并不相關。隨著深度學習的發展,機器閱讀理解進入了神經網絡時代。相關技術的進步給模型的效率和質量都帶來了很大的提升。
- 上一個:AGV助力物流行業持續提速
- 下一個:互聯時代,智慧城市建設日益提速