首頁 > 期刊 > 自然科學(xué)與工程技術(shù) > 信息科技 > 計算機軟件及計算機應(yīng)用 > 現(xiàn)代圖書情報技術(shù) > 文本相似度計算方法研究綜述 【正文】
摘要:【目的】分析文本相似度計算方法,了解該領(lǐng)域的發(fā)展態(tài)勢。【文獻范圍】在CNKI和Web of Science中分別以檢索式“篇名:文本相似度OR篇名:詞匯相似度OR篇名:語義相似度”和“TI:‘text similarity’or‘semantic similarity’or‘lexical similarity’”并限定文獻類型進行檢索,最終得到69篇重點文獻。【方法】對文本相似度計算方法進行系統(tǒng)梳理,分析重點方法的基本思想、特點并總結(jié)未來發(fā)展方向?!窘Y(jié)果】形成了較為全面的分類描述體系,文本相似度計算方法可分為4類:基于字符串的方法、基于語料庫的方法、基于世界知識的方法和其他方法。其中,基于神經(jīng)網(wǎng)絡(luò)和基于世界知識的方法以及針對跨領(lǐng)域文本的相似度計算將成為該領(lǐng)域的發(fā)展趨勢?!揪窒蕖績H將不同方法本身作為探討的核心,未進一步分析方法的應(yīng)用情況?!窘Y(jié)論】有助于全面把握和深入了解文本相似度計算方法的研究現(xiàn)狀和未來趨勢。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社
主管單位:中國科學(xué)院;主辦單位:中國科學(xué)院文獻情報中心
一對一咨詢服務(wù)、簡單快捷、省時省力
了解更多 >直郵到家、實時跟蹤、更安全更省心
了解更多 >去除中間環(huán)節(jié)享受低價,物流進度實時通知
了解更多 >正版雜志,匹配度高、性價比高、成功率高
了解更多 >