欢迎来到优发表,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)

SCI投稿辅导 SCI发表咨询

基于文本加权KNN算法的中文垃圾短信过滤

作者:黄文明; 莫阳 桂林电子科技大学广西可信软件重点实验室; 广西桂林541004; 桂林电子科技大学计算机与信息安全学院; 广西桂林541004

摘要:针对K最近邻(KNN)算法在文本分类决策规则上由于样本重要性相同而导致分类效果不佳的问题,提出一种基于文本加权的KNN文本分类算法,并将其应用于垃圾短信的分类问题。在提取出特征词之后,考虑到特征词在文本中出现的频率对文本重要性的影响,引入第1个加权公式,同时针对垃圾短信数据集,采用关联规则算法挖掘出在垃圾短信中频繁出现的共现词组,并以此引入第2个加权公式,最后将引入的2种文本权重计算公式对每个短信文本进行复合加权处理,以区分各个训练样本对于判定隶属类别的影响程度,从而在分类决策规则上作出改进。实验结果表明,与未经过文本加权的KNN算法相比,该算法对垃圾短信和正常短信在分类准确率、召回率、F1值等指标上都有较大的提升。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程

北大期刊 下单

国际刊号:1000-3428

国内刊号:31-1289/TP

杂志详情
相关热门期刊

服务介绍LITERATURE

正规发表流程 加急见刊

多年专注期刊服务,熟悉发表政策,投稿全程指导。因为专注所以专业。

保障正刊 双刊号

推荐期刊保障正刊,评职认可,企业资质合规可查。

用户信息严格保密

诚信服务,签订协议,严格保密用户信息,提供正规票据。

不成功可退款

如果发表不成功可退款或转刊。资金受第三方支付宝监管,安全放心。