• 设为首页
  • 加入收藏
  • 联系邮箱
  • 网站首页
  • 期刊介绍
    • 期刊简介
    • 历任主编
    • 期刊荣誉
  • 编委会
    • 社长及主编
    • 主任委员
    • 编委名单
  • 投稿指南
    • 作者须知
    • 投稿步骤
    • 范文(规范细则)
    • 稿件处理流程
    • 著作权转让协议
  • 期刊影响力
  • 开放获取
  • 出版道德政策
    • 出版伦理声明
    • 学术不端认定和处理方法
    • 广告及市场推广
    • 同行评议流程
    • 斟误和撤回
    • 回避制度
    • 文章署名及版权转让
  • 历年目次
  • 联系我们
  • English
站内检索    
 
王孝慈,董树锋,刘育权,王莉,李俊格.基于改进式k-prototypes聚类的坏数据辨识与修正[J].电测与仪表,2022,59(2):9-15.
Wang Xiaoci,Dong Shufeng,Liu Yuquan,Wang Li,Li Junge.Bad data identification and correction method based on improved k-prototypes clustering[J].Electrical Measurement & Instrumentation,2022,59(2):9-15.
基于改进式k-prototypes聚类的坏数据辨识与修正
Bad data identification and correction method based on improved k-prototypes clustering
DOI:10.19753/j.issn1001-1390.2022.02.002
中文关键词:  k-prototypes 聚类  混合数据集聚类  坏数据辨识  类中心置换修正法  工业负荷预处理
英文关键词:k-prototypes clustering, mixed dataset clustering, bad data identification, correction with centroid vector replacing, industrial load data preprocessing
基金项目:国家重点研发计划项目(2016YFB0901300)
              
作者中文名作者英文名单位
王孝慈Wang Xiaoci浙江大学电气工程学院
董树锋Dong Shufeng浙江大学电气工程学院
刘育权Liu Yuquan广州供电局有限公司
王莉Wang Li广州供电局有限公司
李俊格Li Junge广州供电局有限公司
摘要点击次数: 1312
中文摘要:
      工业领域很多技术的实现都以准确的负荷数据为基础,而工厂现有的负荷数据测量体系常因为通信、存储等故障,导致负荷数据中出现大量坏数据。因此,提出基于改进式k-prototypes聚类的坏数据辨识与修正方法,通过在聚类中引入非负荷数据特征,削弱负荷坏数据对聚类结果的影响,使坏数据辨识和修复结果更准确。改进式k-prototypes算法通过随机初始化,并行计算择优,克服了标准k-prototypes容易随初始聚类中心陷入局部最优解的缺陷;并通过聚类数量的自适应处理,解决了主观决定聚类数量的问题。基于聚类结果,根据正态分布原则确定负荷数据可行域,识别坏数据,并利用类中心置换法进行修正。实验表明,该方法较只考虑负荷数据的模糊均值聚类法效果更好,坏数据识别的召回率与修正的准确率显著提高。
英文摘要:
      The realization of many technologies in the industrial field is based on accurate load data, while the existing measurement system in factories often results in a large number of bad data due to communication and storage failures. Therefore, an industrial load data identification and correction method based on improved k-prototypes clustering algorithm is proposed to reduce the impact of bad load data on the clustering results by introducing characteristics of non-load data in clustering, so as to make the identification and repair results more accurate. Through random initialization and parallel calculation optimization, the improved k-prototypes algorithm overcomes the defect that standard algorithm tends to fall into the local optimal solution. And the problem of subjectively determining the number of clusters is solved by adaptive processing. Based on the clustering results, the feasible region of load data is determined according to the principle of normal distribution, and the bad data is identified. The identified bad data is corrected by centroid vector replacing. Experiments show that the proposed method outperforms the fuzzy C-means clustering method which only considers the load data, and the recall rate and correction accuracy of bad data identification are significantly improved.
查看全文  查看/发表评论  下载PDF阅读器
关闭
  • 哈尔滨电工仪表研究所有限公司
  • 中国电工仪器仪表信息网
  • 中国仪器仪表学会
  • 中华人民共和国新闻出版总署
  • 中国科技期刊编辑学会
  • 黑龙江省科学技术协会
  • 编辑之家
  • 中国知网
  • 万方数据库
  • 维普网
  • 北极星电力网
  • 中华中控网
  • 网站首页
  • 期刊介绍
    • 期刊简介
    • 历任主编
    • 期刊荣誉
  • 编委会
    • 社长及主编
    • 主任委员
    • 编委名单
  • 投稿指南
    • 作者须知
    • 投稿步骤
    • 范文(规范细则)
    • 稿件处理流程
    • 著作权转让协议
  • 期刊影响力
  • 开放获取
  • 出版道德政策
    • 出版伦理声明
    • 学术不端认定和处理方法
    • 广告及市场推广
    • 同行评议流程
    • 斟误和撤回
    • 回避制度
    • 文章署名及版权转让
  • 历年目次
  • 联系我们
地址:哈尔滨市松北区创新路2000号    邮编:150028
邮箱:dcyb@vip.163.com    电话:0451-86611021;87186023
© 2012 电测与仪表    哈公网监备2301003445号
黑ICP备11006624号-1
技术支持:北京勤云科技发展有限公司