您现的位置:首页 > 数据库检索 > 中文期刊 

基于在线性能测试的概念漂移检测方法*

加收藏
  • 【题名】:基于在线性能测试的概念漂移检测方法*
  • 【年份】:2020
  • 【作者】:郭虎升,张爱娟,王文剑
  • 【关键词】:流数据  概念漂移  交叉检验  有效波动位点  一致波动位点  概念漂移位点
  • 【摘要】:概念漂移是动态流数据挖掘中一类常见的问题,但混杂噪声或训练样本规模过小而产生的伪概念漂移会引起与真实概念漂移相似的结果,即模型在线测试性能的不稳定波动,导致二者容易混淆,发生概念漂移的误报.针对流数据中真伪概念漂移的混淆问题,提出一种基于在线性能测试的概念漂移检测方法(concept drift detection method based on online performance test,简称CDPT).该方法将最新获得的数据集进行均匀分组,在每组子数据集上分别进行在线学习,同时记录每组子数据集训练测试得到的分类精度向量,并计算相邻学习时间单元之间的精度落差,依据测试精度下降阈值得到有效波动位点.然后采用交叉检验的方式整合不同分组中的有效波动位点,以消除流数据在线学习过程中由于训练样本过小导致模型不稳定造成的检测干扰,根据精度波动一致性得到一致波动位点.最后,通过跟踪在线学习分类准确率,得到一致波动位点邻域参照点的测试精度变化,比较一致波动位点邻域参照点对应的模型测试精度下降幅度及收敛情况,以有效检测一致波动位点当中真实的概念漂移位点.实验结果表明,该方法能够有效辨识流数据在线学习过程中发生的真实概念漂移,并能有效避免训练样本过小或者流数据中噪声对检测结果的负面影响,同时提高模型的泛化性能.
  • 【期刊名】:软件学报
  • 【分类号】:TP181
  • 【期号】:第4期
  • 【作者简介】:郭虎升 (1986-),男,博士,副教授,CCF 专业会员,主要研究领域为数据挖掘,机器学习,计算智能. 王文剑 (1968-),女,博士,教授,博士生导师,CCF 高级会员,主要研究领域为机器学习,数据挖掘,计算智能. 张爱娟 (1993-),女,硕士生,主要研究领域为流数据挖掘,机器学习.
  • 【作者单位】:山西大学计算机与信息技术学院;计算智能与中文信息处理教育部重点实验室(山西大学)
  • 【页码】:932-947
相关文献
新型酶解木质素酚醛泡沫制备及性能研究<sup>*sup>
监管科技运用与制度完善<sup>※sup> ——基于信息型操纵视角
生物炭/铁酸锰对Zn<sup>2+sup>和Cu<sup>2+sup>吸附性能试验
GPS垂向年周期运动精确获取与方法评估<sup>*sup>
基于改进线性调频Z变换高精度地震波速干涉测量<sup>*sup>
吡喃糖氧化酶法检测血清1,5-脱水葡萄糖醇方法性能评价
基于自主研发软件框架在地震应用系统开发中的研究和应用<sup>*sup>
木材及木基材料吸湿尺寸稳定性检测方法研究<sup>*sup>
基于Eu<sup>2+sup>与Sm<sup>3+sup>几种新型多色长余辉材料
基于DAG 分布式账本共识机制研究<sup>*sup>
获取此文方式
CNKI期刊
下载请求:
   

说明:点击”存到网盘“按钮即收取费用,重复点击不收费,如果下载失败,我们会自动转为文献传递方式处理,稍侯请关注您网盘上该文献的信息,从网盘上下载该文献不用重新付费。