摘要:针对传统的RNN算法存在梯度消失的缺陷,在面对海量新闻数据,规模大且分类属性多的情况下存在效率低的问题,该文应用了传统的RNN模型改进后的LSTM神经网络算法,加入了预训练的word2vec模型。首先对新闻数据进行去除停用词及标点、格式转化、分词等预处理;其次进行特征提取、分类模型构造;最后进行了分类模型训练与测试。测试数据表明,在大数据量的情况下,使用LSTM算法具有较高的模型准确度和良好的扩展性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社。
梧州学院学报杂志, 双月刊,本刊重视学术导向,坚持科学性、学术性、先进性、创新性,刊载内容涉及的栏目:经济与管理、政治与法律、文化与艺术、教育与教学、计算机科学与技术、基础理论、计算机科学与技术研究等。于1991年经新闻总署批准的正规刊物。