欢迎来到优发表,学术咨询:400-888-9411 订阅咨询:400-888-1571

关于我们 购物车(0)

面向不均衡数据集中少数类细分的过采样算法

作者:古平; 杨炀 重庆大学计算机学院; 重庆400044

摘要:在不均衡数据集中,少数类样本的分布相对于决策边界具有差异性,而传统的过抽样算法通常并未对差异性做不同处理。为此,提出一种面向不均衡数据集的过采样算法SD-ISMOTE。该算法根据少数类样本的k近邻分布将其细分为DANGER,AL_SAFE,SAFE 3个集合,DANGER和AL_SAFE中的样本更靠近决策边界。借助ISMOTE思想在n维球体内随机插值,扩大两类样本的过采样范围,同时引入轮盘赌选择算法进行采样选择,避免新生成的样本冗余。实验结果表明,SD-ISMOTE算法在C4.5和朴素贝叶斯分类器下的分类性能相较于Borderline-SMOTE和ISMOTE均有不同程度的提高,可有效解决数据集中样本分布不均衡的问题。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机工程

CSCD核心期刊 审稿

国际刊号:1000-3428

国内刊号:31-1289/TP

杂志详情
相关热门期刊
  • 计算机科学
    CSCD核心期刊 审稿

    国际刊号:1002-137X

    国内刊号:50-1075/TP

  • 计算机工程
    CSCD核心期刊 审稿

    国际刊号:1000-3428

    国内刊号:31-1289/TP

  • 电子商务
    CSCD核心期刊 审稿

    国际刊号:1009-6108

    国内刊号:11-4499/TN

  • 机电一体化
    CSCD核心期刊 审稿

    国际刊号:1007-080X

    国内刊号:31-1714/TM

服务推荐LITERATURE

荐稿服务

多数单位评职级必备,没有发文章将无法获得晋升

文秘服务

免费修改,直到您满意之后,再完成交付

论著出书

越来越多的单位晋升已经把出书列为必要项目独立加分

专利服务

保护知识产权免受侵害,独占市场、加分评优评级

81747已注册会员

9743已收录期刊

35896已服务客户

29743用户好评

学术顾问

免费咨询 投稿咨询 文秘服务 订阅服务 客服电话 免费咨询电话400-888-9411