欧洲成人午夜精品无码区久久_久久精品无码专区免费青青_av无码电影一区二区三区_各种少妇正面着bbw撒尿视频_中文精品久久久久国产网址

首頁 > 期刊 > 自然科學(xué)與工程技術(shù) > 信息科技 > 電子信息科學(xué)綜合 > 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn) > 基于機(jī)器學(xué)習(xí)的社交媒體用戶分類研究 【正文】

基于機(jī)器學(xué)習(xí)的社交媒體用戶分類研究

李綱; 周華陽; 毛進(jìn); 陳思菁 武漢大學(xué)信息資源研究中心; 武漢430072
  • 支持向量機(jī)
  • 用戶分類
  • 機(jī)器學(xué)習(xí)
  • 特征提取

摘要:【目的】充分利用社交媒體用戶的個(gè)人多維度信息,研究用戶自動(dòng)分類問題?!痉椒ā繉⑸缃幻襟w用戶定義為個(gè)體民眾、媒體、政府和組織4種類型,從用戶多維度信息中提取人口統(tǒng)計(jì)學(xué)、命名和自我描述三組特征,構(gòu)建基于機(jī)器學(xué)習(xí)算法的用戶自動(dòng)分類模型,在Twitter真實(shí)數(shù)據(jù)集上通過實(shí)驗(yàn)對(duì)比各分類算法性能,并分析各組特征的貢獻(xiàn)度?!窘Y(jié)果】支持向量機(jī)和隨機(jī)梯度下降分類模型的準(zhǔn)確率和召回率均在83%以上,命名、人口統(tǒng)計(jì)學(xué)和自我描述特征對(duì)于分類性能的影響依次遞增。【局限】由于標(biāo)注的用戶數(shù)量有限,可能無法讓模型充分學(xué)習(xí)用戶特征,而且沒有考慮不同類型用戶數(shù)量的不均衡問題?!窘Y(jié)論】基于支持向量機(jī)和隨機(jī)梯度下降的分類模型能夠較準(zhǔn)確地識(shí)別出4種類型用戶,對(duì)后續(xù)社交媒體用戶劃分研究具有借鑒意義。

注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社

投稿咨詢 文秘咨詢

數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)

  • 預(yù)計(jì)1-3個(gè)月 預(yù)計(jì)審稿周期
  • 1.2 影響因子
  • 計(jì)算機(jī) 快捷分類
  • 月刊 出版周期

主管單位:中國科學(xué)院;主辦單位:中國科學(xué)院文獻(xiàn)情報(bào)中心

我們提供的服務(wù)

服務(wù)流程: 確定期刊 支付定金 完成服務(wù) 支付尾款 在線咨詢