欢迎来到优发表,学术咨询:400-888-9411 订阅咨询:400-888-1571

关于我们 购物车(0)

基于文本加权KNN算法的中文垃圾短信过滤

作者:黄文明; 莫阳 桂林电子科技大学广西可信软件重点实验室; 广西桂林541004; 桂林电子科技大学计算机与信息安全学院; 广西桂林541004

摘要:针对K最近邻(KNN)算法在文本分类决策规则上由于样本重要性相同而导致分类效果不佳的问题,提出一种基于文本加权的KNN文本分类算法,并将其应用于垃圾短信的分类问题。在提取出特征词之后,考虑到特征词在文本中出现的频率对文本重要性的影响,引入第1个加权公式,同时针对垃圾短信数据集,采用关联规则算法挖掘出在垃圾短信中频繁出现的共现词组,并以此引入第2个加权公式,最后将引入的2种文本权重计算公式对每个短信文本进行复合加权处理,以区分各个训练样本对于判定隶属类别的影响程度,从而在分类决策规则上作出改进。实验结果表明,与未经过文本加权的KNN算法相比,该算法对垃圾短信和正常短信在分类准确率、召回率、F1值等指标上都有较大的提升。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程

CSCD核心期刊 审稿

国际刊号:1000-3428

国内刊号:31-1289/TP

杂志详情
相关热门期刊
  • 计算机科学
    CSCD核心期刊 审稿

    国际刊号:1002-137X

    国内刊号:50-1075/TP

  • 计算机工程
    CSCD核心期刊 审稿

    国际刊号:1000-3428

    国内刊号:31-1289/TP

  • 电子商务
    CSCD核心期刊 审稿

    国际刊号:1009-6108

    国内刊号:11-4499/TN

  • 机电一体化
    CSCD核心期刊 审稿

    国际刊号:1007-080X

    国内刊号:31-1714/TM

服务推荐LITERATURE

荐稿服务

多数单位评职级必备,没有发文章将无法获得晋升

文秘服务

免费修改,直到您满意之后,再完成交付

论著出书

越来越多的单位晋升已经把出书列为必要项目独立加分

专利服务

保护知识产权免受侵害,独占市场、加分评优评级

81747已注册会员

9743已收录期刊

35896已服务客户

29743用户好评

学术顾问

免费咨询 投稿咨询 文秘服务 订阅服务 客服电话 免费咨询电话400-888-9411