您现的位置:首页 > 数据库检索 > 中文期刊 

面向众包数据清洗的主动学习技术*

加收藏
  • 【题名】:面向众包数据清洗的主动学习技术*
  • 【年份】:2020
  • 【作者】:叶晨,王宏志,高宏,李建中
  • 【关键词】:众包  数据清洗  主动学习  机器学习  领域专家
  • 【摘要】:传统方法多数采用机器学习算法对数据进行清洗.这些方法虽然能够解决部分问题,但存在计算难度大、缺乏充足的知识等局限性.近年来,随着众包平台的兴起,越来越多的研究将众包引入数据清洗过程,通过众包来提供机器学习所需要的知识.由于众包的有偿性,研究如何将机器学习算法与众包有效且低成本结合在一起是必要的.提出了两种支持基于众包的数据清洗的主动学习模型,通过主动学习技术来减少众包开销,实现了对给定的数据集基于真实众包平台的数据清洗,最大程度减少成本的同时提高了数据的质量.在真实数据集上的实验结果验证了所提模型的有效性.
  • 【期刊名】:软件学报
  • 【分类号】:TP311.13;TP181
  • 【期号】:第4期
  • 【资金项目】:国家自然科学基金(U1509216,U1866602,61472099,61602129);国家重点研发计划(2016YFB1000703);黑龙江省留学归国人员科学基金(LC2016026)
  • 【作者简介】:叶晨 (1992-),女,浙江乐清人,硕士,CCF学生会员,主要研究领域为数据质量,劣质数据清洗,真值发现与模式发现. 王宏志 (1978-),男,博士,教授,博士生导师,CCF 杰出会员,主要研究领域为数据质量管理,海量数据管理,知识图谱,XML 数据管理,工业大数据. 高宏 (1966-),女,博士,教授,博士生导师,CCF 杰出会员,主要研究领域为复杂结构数据管理,无线传感器网络. 李建中 (1950-),男,博士,教授,博士生导师,CCF 会士,主要研究领域为数据库系统实现技术,数据仓库,半结构化数据,传感器网络,压缩数据库技术,Web 数据集成,数据挖掘,计算生物学.
  • 【作者单位】:哈尔滨工业大学计算机科学与技术学院
  • 【页码】:1162-1172
相关文献
“共同利益”理念对构建服务全民终身学习教育体系启示 <sup>*sup>
职业教育服务乡村振兴技术逻辑与价值旨归 <sup>*sup>
人工智能教育大脑:以数据驱动教育治理与教学创新技术框架 <sup>*sup>
中央转移支付和地方财政缺口:制度环境下省级数据阈值效应分析<sup>*sup>
新兴技术风险挑战及其适应性治理<sup>*sup>
基于多频段融合全景图像拼接技术<sup>*sup>
基于数据络分析农机维修企业技术效率研究
基于高通量测序技术脾虚腹泻型肠易激综合征小鼠与健康小鼠肠道菌群差异研究<sup>*sup>
医学院校在线开放课程学习效果影响因素分析及对策<sup>*sup>
基于舌诊偏色与去干扰计算机技术研究<sup>∗sup>
获取此文方式
CNKI期刊
万方期刊
下载请求:
   

说明:点击”存到网盘“按钮即收取费用,重复点击不收费,如果下载失败,我们会自动转为文献传递方式处理,稍侯请关注您网盘上该文献的信息,从网盘上下载该文献不用重新付费。