结合主题模型词向量的CNN文本分类

作者：牛雪莹太原科技大学计算机科学与技术学院; 山西太原030024

摘要：挖掘微博文本中的信息对自动问答、舆情分析等应用研究具有重要意义。文本数据的分类研究是文本数据挖掘的基础。本文提出将Word2vec和LDA(Latent Dirichlet Allocation)的文本表示同时输入卷积神经网络模型进行高层语义特征抽象和分类学习,使得输入的词向量既能表现词语之间的语义信息又能体现文本的主题思想。首先用Word2vec和LDA模型分别在语料库中学习产生词向量,然后词向量分别级联得到各自的文本矩阵表示,最后将文本矩阵作为2个通道同时输入到卷积神经网络做分类训练,并通过微博数据实验验证了该方法的有效性。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社。

投稿咨询期刊咨询

计算机与现代化杂志

计算机与现代化杂志，月刊，本刊重视学术导向，坚持科学性、学术性、先进性、创新性，刊载内容涉及的栏目：算法设计与分析、数据库与数据挖掘、软件工程、操作系统、人工智能、图像处理、计算机仿真、计算机控制、网络与通信、信息安全、电子商务、计算机辅助设计、计算机辅助教学、信息系统与ERP、中文信息技术、多媒体技术、农村信息化技术、应用与开发等等。于1985年经新闻总署批准的正规刊物。

统计源期刊
1-3个月审核

杂志详情

服务介绍LITERATURE

正规发表流程全程指导

多年专注期刊服务，熟悉发表政策，投稿全程指导。因为专注所以专业。

保障正刊双刊号

推荐期刊保障正刊，评职认可，企业资质合规可查。

用户信息严格保密

诚信服务，签订协议，严格保密用户信息，提供正规票据。

不成功可退款

如果发表不成功可退款或转刊。资金受第三方支付宝监管，安全放心。

结合主题模型词向量的CNN文本分类

计算机与现代化杂志

相关期刊JOURNALS

计算机

航空计算技术

现代计算机

计算物理

计算数学

心智与计算

服务介绍LITERATURE

正规发表流程全程指导

保障正刊双刊号

用户信息严格保密

不成功可退款

结合主题模型词向量的CNN文本分类

计算机与现代化杂志

相关期刊JOURNALS

计算机

航空计算技术

现代计算机

计算物理

计算数学

心智与计算

服务介绍LITERATURE

正规发表流程 全程指导

保障正刊 双刊号

用户信息严格保密

不成功可退款

正规发表流程全程指导

保障正刊双刊号