文本相似度計算方法研究綜述

陳二靜; 姜恩波

文本相似度
語義相似度
本體
詞袋模型
神經(jīng)網(wǎng)絡(luò)

摘要：【目的】分析文本相似度計算方法,了解該領(lǐng)域的發(fā)展態(tài)勢。【文獻范圍】在CNKI和Web of Science中分別以檢索式“篇名:文本相似度OR篇名:詞匯相似度OR篇名:語義相似度”和“TI:‘text similarity’or‘semantic similarity’or‘lexical similarity’”并限定文獻類型進行檢索,最終得到69篇重點文獻。【方法】對文本相似度計算方法進行系統(tǒng)梳理,分析重點方法的基本思想、特點并總結(jié)未來發(fā)展方向?！窘Y(jié)果】形成了較為全面的分類描述體系,文本相似度計算方法可分為4類:基于字符串的方法、基于語料庫的方法、基于世界知識的方法和其他方法。其中,基于神經(jīng)網(wǎng)絡(luò)和基于世界知識的方法以及針對跨領(lǐng)域文本的相似度計算將成為該領(lǐng)域的發(fā)展趨勢?！揪窒蕖績H將不同方法本身作為探討的核心,未進一步分析方法的應(yīng)用情況?！窘Y(jié)論】有助于全面把握和深入了解文本相似度計算方法的研究現(xiàn)狀和未來趨勢。

注：因版權(quán)方要求，不能公開全文，如需全文，請咨詢雜志社

投稿咨詢文秘咨詢

現(xiàn)代圖書情報技術(shù)

預(yù)計1-3個月 預(yù)計審稿周期
1.45 影響因子
新聞快捷分類
月刊出版周期

主管單位：中國科學(xué)院;主辦單位：中國科學(xué)院文獻情報中心

雜志詳情

欧洲成人午夜精品无码区久久_久久精品无码专区免费青青_av无码电影一区二区三区_各种少妇正面着bbw撒尿视频_中文精品久久久久国产网址

文本相似度計算方法研究綜述

現(xiàn)代圖書情報技術(shù)

我們提供的服務(wù)

在線客服

快遞配送

雜志訂閱

雜志推薦

相關(guān)期刊