实时文本分类系统的研究与实现
作者:黄旭 朱艳琴 罗喜召 苏州大学计算机科学与技术学院 苏州215006
摘要:分析文本分类过程中影响实时性的因素,即分词处理高耗时和特征空间维数过高问题。结合网页过滤的实时应用提出一种实时文本分类方法,弱化分词处理过程,降低特征空间维数,以提高分类速度。通过优化特征项选取维持分类效果,基于贝叶斯理论实现实时文本分类系统。实验结果表明,该方法在维持精确率和召回率分别为85%,94%的情况下,显著提高了分类速度。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社