首頁(yè) > 期刊 > 自然科學(xué)與工程技術(shù) > 信息科技 > 電信技術(shù) > 電視技術(shù) > 脫機(jī)手寫維吾爾單詞提取 【正文】
摘要:針對(duì)維吾爾單詞切分問題提出了FCM融合K-means的聚類算法,應(yīng)用FCM聚類的結(jié)果將字符間距聚類兩類,根據(jù)聚類結(jié)果再將字符間距分類為三類:單詞內(nèi)間距、單詞間距離、第三類間距;將字符長(zhǎng)度聚類為:單詞、連體段、字母。首先對(duì)單詞內(nèi)距離進(jìn)行處理,再針對(duì)不同的字符間距和不同的字符長(zhǎng)度進(jìn)行分步切分處理,最后對(duì)切分后的字符進(jìn)行欠切分處理。以12幅不同的人書寫的維吾爾脫機(jī)手寫文本圖像為實(shí)驗(yàn)對(duì)象,1 042個(gè)單詞,正確切分率達(dá)到74.28%。該方法不僅僅提高了切分的正確率,并且可以同時(shí)解決部分重疊和粘連問題。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社
主管單位:中國(guó)電子科技集團(tuán)有限公司;主辦單位:電視電聲研究所(中國(guó)電子科技集團(tuán)公司第三研究所)