欢迎来到优发表网,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)

购物车(0)

结合主题模型词向量的CNN文本分类

作者:牛雪莹 太原科技大学计算机科学与技术学院; 山西太原030024

摘要:挖掘微博文本中的信息对自动问答、舆情分析等应用研究具有重要意义。文本数据的分类研究是文本数据挖掘的基础。本文提出将Word2vec和LDA(Latent Dirichlet Allocation)的文本表示同时输入卷积神经网络模型进行高层语义特征抽象和分类学习,使得输入的词向量既能表现词语之间的语义信息又能体现文本的主题思想。首先用Word2vec和LDA模型分别在语料库中学习产生词向量,然后词向量分别级联得到各自的文本矩阵表示,最后将文本矩阵作为2个通道同时输入到卷积神经网络做分类训练,并通过微博数据实验验证了该方法的有效性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机与现代化

统计源期刊 下单

国际刊号:1006-2475

国内刊号:36-1137/TP

杂志详情
相关热门期刊

服务介绍LITERATURE

正规发表流程 全程指导

多年专注期刊服务,熟悉发表政策,投稿全程指导。因为专注所以专业。

保障正刊 双刊号

推荐期刊保障正刊,评职认可,企业资质合规可查。

用户信息严格保密

诚信服务,签订协议,严格保密用户信息,提供正规票据。

不成功可退款

如果发表不成功可退款或转刊。资金受第三方支付宝监管,安全放心。