螞蟻集團AntInsBert模型登頂CLUE閱讀理解榜 打破歷史記錄

8月10日消息,日前,中文語言理解測評基準(CLUE)閱讀理解排行榜顯示,螞蟻集團保險科技團隊的AntInsBert模型以92.475的得分,打破了CLUE閱讀理解榜的歷史紀錄,排名第一。
據了解,機器閱讀理解技術一直是語義理解領域最為關鍵的能力之一。機器閱讀理解技術難度高、理解復雜,不僅要求AI對內容進行閱讀和理解,還需要針對相關問題,推理總結出正確答案。
據悉,憑借多年來在自然語言處理方面的深耕,螞蟻保險科技團隊自主研發了預訓練語言模型——AntInsBert。該模型僅包含十億參數量,是業界百億大模型的十分之一,主要在兩個技術上進行了升級。
首先,AntInsBert對傳統語言模型預訓練方案做了改進,設計了基于Prompt的知識增強預訓練方案,將海量知識圖譜內容引入到預訓練模型當中。
其次,為進一步挖掘AntInsBert在機器閱讀理解算法上的潛力,該方案將文本分類、信息抽取、指代消解等常見的中文語義理解任務,通過模板轉化為閱讀理解任務,進一步提升了模型的范化性。
此前,在第11屆CCF自然語言處理與中文計算會議(NLPCC)上,螞蟻集團保險科技團隊憑借多年來在保險領域對話理解的技術積累,獲得“細粒度對話社會偏見識別”評測任務第一名。
目前,AntInsBert模型已經在螞蟻保“金選”和“安心賠”等保險服務環節得到了應用。例如,為了降低消費者決策難度,螞蟻保險團隊借助機器閱讀理解系統對保險條款進行閱讀,將用戶最關心的投保門檻、保障范圍、價格等因素進行結構化,并組織專家團隊橫向對比了市場上數千款保險產品,盡量保證螞蟻保“金選”篩選出平臺上綜合競爭力最強的保險產品。
與此同時,機器閱讀理解也運用在螞蟻保“安心賠”服務中,通過對用戶上傳的理賠材料的理解,實現了理賠流程的自動化與智能化,大幅縮短傳統人工審核的耗時。以人保健康承保的好醫保長期醫療險為例,對于理賠金額小于2萬元的理賠案件,90%以上都可保證實現安心賠“2日快賠”。
(圖源 螞蟻保微博)
