• 设为首页
  • 加入收藏
  • 联系邮箱
  • 网站首页
  • 期刊介绍
    • 期刊简介
    • 历任主编
    • 期刊荣誉
  • 编委会
    • 社长及主编
    • 主任委员
    • 编委名单
  • 投稿指南
    • 作者须知
    • 投稿步骤
    • 范文(规范细则)
    • 稿件处理流程
    • 著作权转让协议
  • 期刊影响力
  • 开放获取
  • 出版道德政策
    • 出版伦理声明
    • 学术不端认定和处理方法
    • 广告及市场推广
    • 同行评议流程
    • 斟误和撤回
    • 回避制度
    • 文章署名及版权转让
  • 历年目次
  • 联系我们
  • English
站内检索    
 
马红明,马浩,杨迪,吴宏波,刘家丞,李骥.基于奇异值阈值理论的电力营销数据在线清洗方法[J].电测与仪表,2024,61(9):120-126.
MA Hongming,MA Hao,YANG Di,WU Hongbo,LIU Jiacheng,LI Ji.An Online Data Cleaning Algorithm for Power Marketing Data Based on Singular Value Thresholding Theory[J].Electrical Measurement & Instrumentation,2024,61(9):120-126.
基于奇异值阈值理论的电力营销数据在线清洗方法
An Online Data Cleaning Algorithm for Power Marketing Data Based on Singular Value Thresholding Theory
DOI:10.19753/j.issn1001-1390.2024.09.016
中文关键词:  数据清洗  电力营销数据  缺省数据恢复  奇异值阈值算法
英文关键词:data cleaning, power marketing data, missing data recovery, singular value thresholding algorithm
基金项目:国家自然科学基金资助项目( 61773308)
                 
作者中文名作者英文名单位
马红明MA Hongming国网河北省电力有限公司
马浩MA Hao国网河北省电力有限公司
杨迪YANG Di国网河北省电力有限公司
吴宏波WU Hongbo国网河北省电力有限公司
刘家丞LIU Jiacheng国网河北省电力有限公司
李骥LI Ji国网河北省电力有限公司
摘要点击次数: 409
中文摘要:
      能源互联网架构下,电力营销大数据是支撑智能电网众多高级应用的关键基础,数据清洗对于电力营销大数据更是极为重要。然而,数据缺失问题会不可避免地出现在实际电网运行环节中,大大影响数据的分析和使用。针对上述问题,本文以Spark大数据在线处理平台为基础,提出了融合相似用户聚类和奇异值阈值理论的在线数据清洗框架和方法。首先借助奇异值分解,证明了电力营销数据具有近似低秩特性。以此为基础,考虑电力用户的用电差异,提出了一种融合改进K最近邻算法和奇异值阈值理论的在线数据清洗框架和方法。同时,针对奇异值阈值模型计算缓慢问题,提出采用滑动时间窗在线修复策略,加快修复速度,提升修复精度。最后,通过河北省某电力营销数据验证了所提算法的有效性,实验结果显示该在线修复算法能够更快速、高效地修复大规模电力营销缺省数据。
英文摘要:
      Under the framework of energy Internet, power marketing big data is the foundation to support many advanced applications of smart grid, and data cleaning is extremely important for power marketing big data. However, the data missing problem will inevitably appear in the actual power grid operation, which greatly affects the analysis and use of data. To solve the above problem, this paper proposes an online data cleaning framework and method based on spark platform, which combines similar user clustering and singular value thresholding theory. Firstly, with the help of singular value decomposition, it is proved that the power data has the characteristics of approximate low rank. On this basis, considering the power consumption difference of power users, this paper proposes an online data cleaning frame-work and method which integrates the improved K-Nearest Neighbor clustering and the theory of singular value threshold-ing. At the same time, in order to solve the problem of slow cal-culation of singular value thresholding model, a sliding time window online recovery strategy is proposed to accelerate the repair speed and improve the recovery accuracy. Finally, the effectiveness of the proposed algorithm is verified by power marketing data of Hebei Province. The experimental results show that the online recovery algorithm can repair the large-scale default data of power marketing more quickly and effectively.
查看全文  查看/发表评论  下载PDF阅读器
关闭
  • 哈尔滨电工仪表研究所有限公司
  • 中国电工仪器仪表信息网
  • 中国仪器仪表学会
  • 中华人民共和国新闻出版总署
  • 中国科技期刊编辑学会
  • 黑龙江省科学技术协会
  • 编辑之家
  • 中国知网
  • 万方数据库
  • 维普网
  • 北极星电力网
  • 中华中控网
  • 网站首页
  • 期刊介绍
    • 期刊简介
    • 历任主编
    • 期刊荣誉
  • 编委会
    • 社长及主编
    • 主任委员
    • 编委名单
  • 投稿指南
    • 作者须知
    • 投稿步骤
    • 范文(规范细则)
    • 稿件处理流程
    • 著作权转让协议
  • 期刊影响力
  • 开放获取
  • 出版道德政策
    • 出版伦理声明
    • 学术不端认定和处理方法
    • 广告及市场推广
    • 同行评议流程
    • 斟误和撤回
    • 回避制度
    • 文章署名及版权转让
  • 历年目次
  • 联系我们
地址:哈尔滨市松北区创新路2000号    邮编:150028
邮箱:dcyb@vip.163.com    电话:0451-86611021;87186023
© 2012 电测与仪表    哈公网监备2301003445号
黑ICP备11006624号-1
技术支持:北京勤云科技发展有限公司