首頁 > 期刊 > 自然科學(xué)與工程技術(shù) > 信息科技 > 電子信息科學(xué)綜合 > 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn) > 基于機(jī)器學(xué)習(xí)的社交媒體用戶分類研究 【正文】
摘要:【目的】充分利用社交媒體用戶的個(gè)人多維度信息,研究用戶自動(dòng)分類問題?!痉椒ā繉⑸缃幻襟w用戶定義為個(gè)體民眾、媒體、政府和組織4種類型,從用戶多維度信息中提取人口統(tǒng)計(jì)學(xué)、命名和自我描述三組特征,構(gòu)建基于機(jī)器學(xué)習(xí)算法的用戶自動(dòng)分類模型,在Twitter真實(shí)數(shù)據(jù)集上通過實(shí)驗(yàn)對(duì)比各分類算法性能,并分析各組特征的貢獻(xiàn)度?!窘Y(jié)果】支持向量機(jī)和隨機(jī)梯度下降分類模型的準(zhǔn)確率和召回率均在83%以上,命名、人口統(tǒng)計(jì)學(xué)和自我描述特征對(duì)于分類性能的影響依次遞增。【局限】由于標(biāo)注的用戶數(shù)量有限,可能無法讓模型充分學(xué)習(xí)用戶特征,而且沒有考慮不同類型用戶數(shù)量的不均衡問題?!窘Y(jié)論】基于支持向量機(jī)和隨機(jī)梯度下降的分類模型能夠較準(zhǔn)確地識(shí)別出4種類型用戶,對(duì)后續(xù)社交媒體用戶劃分研究具有借鑒意義。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社
主管單位:中國科學(xué)院;主辦單位:中國科學(xué)院文獻(xiàn)情報(bào)中心
一對(duì)一咨詢服務(wù)、簡單快捷、省時(shí)省力
了解更多 >直郵到家、實(shí)時(shí)跟蹤、更安全更省心
了解更多 >去除中間環(huán)節(jié)享受低價(jià),物流進(jìn)度實(shí)時(shí)通知
了解更多 >正版雜志,匹配度高、性價(jià)比高、成功率高
了解更多 >