首頁(yè) > 期刊 > 自然科學(xué)與工程技術(shù) > 信息科技 > 電子信息科學(xué)綜合 > 計(jì)算機(jī)學(xué)報(bào) > 一種融合語(yǔ)義資源的生物醫(yī)學(xué)查詢理解方法 【正文】
摘要:近年來(lái),隨著生物醫(yī)學(xué)相關(guān)研究的快速發(fā)展,生物醫(yī)學(xué)文獻(xiàn)的數(shù)量與日俱增,相關(guān)人員從海量文獻(xiàn)中獲取所需信息變得越來(lái)越困難,信息檢索技術(shù)能夠?yàn)橛脩籼峁┧栊畔?但由于領(lǐng)域?qū)I(yè)度高,術(shù)語(yǔ)龐雜,傳統(tǒng)通用領(lǐng)域的檢索技術(shù)往往很難勝任這項(xiàng)任務(wù),而生物醫(yī)學(xué)領(lǐng)域存在豐富的語(yǔ)義資源,這些資源涵蓋該領(lǐng)域?qū)I(yè)術(shù)語(yǔ),可以對(duì)文獻(xiàn)檢索起到輔助和提升作用.因此,為進(jìn)一步提升生物醫(yī)學(xué)文獻(xiàn)檢索的性能,該文嘗試基于詞共現(xiàn)查詢擴(kuò)展模型,結(jié)合生物醫(yī)學(xué)領(lǐng)域特征,利用醫(yī)學(xué)主題詞表衡量擴(kuò)展詞的重要性,綜合權(quán)衡擴(kuò)展詞與查詢?cè)~的共現(xiàn)關(guān)系和擴(kuò)展詞在醫(yī)學(xué)主題詞表中的分布情況,選擇優(yōu)質(zhì)擴(kuò)展詞;并在此基礎(chǔ)上提出一種基于組排序?qū)W習(xí)的監(jiān)督式查詢擴(kuò)展方法,該方法根據(jù)候選擴(kuò)展詞對(duì)檢索性能的影響和候選擴(kuò)展詞能否反映查詢的主題信息兩個(gè)方面對(duì)擴(kuò)展詞進(jìn)行相關(guān)性標(biāo)注,提取與擴(kuò)展詞相關(guān)的上下文特征和領(lǐng)域語(yǔ)義特征對(duì)擴(kuò)展詞進(jìn)行向量化表示,最后采用組排序?qū)W習(xí)方法訓(xùn)練擴(kuò)展詞選擇模型,完成查詢擴(kuò)展.在TREC基因任務(wù)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該方法能夠有效提升查詢擴(kuò)展性能,與基于排序?qū)W習(xí)方法ListMLE的監(jiān)督式查詢擴(kuò)展方法相比,在文檔平均準(zhǔn)確率方面分別提升4.41%和11.35%,有效提升了生物醫(yī)學(xué)文獻(xiàn)檢索的綜合性能.
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社
主管單位:中國(guó)科學(xué)院;主辦單位:中國(guó)計(jì)算機(jī)學(xué)會(huì);中國(guó)科學(xué)院計(jì)算技術(shù)研究所
一對(duì)一咨詢服務(wù)、簡(jiǎn)單快捷、省時(shí)省力
了解更多 >直郵到家、實(shí)時(shí)跟蹤、更安全更省心
了解更多 >去除中間環(huán)節(jié)享受低價(jià),物流進(jìn)度實(shí)時(shí)通知
了解更多 >正版雜志,匹配度高、性價(jià)比高、成功率高
了解更多 >