• 设为首页
  • 加入收藏
  • 联系邮箱
  • 网站首页
  • 期刊介绍
    • 期刊简介
    • 历任主编
    • 期刊荣誉
  • 编委会
    • 社长及主编
    • 主任委员
    • 编委名单
  • 投稿指南
    • 作者须知
    • 投稿步骤
    • 范文(规范细则)
    • 稿件处理流程
    • 著作权转让协议
  • 期刊影响力
  • 开放获取
  • 出版道德政策
    • 出版伦理声明
    • 学术不端认定和处理方法
    • 广告及市场推广
    • 同行评议流程
    • 斟误和撤回
    • 回避制度
    • 文章署名及版权转让
  • 历年目次
  • 联系我们
  • English
站内检索    
 
余宏晖,林声宏,朱建全,陈浩悟.基于深度强化学习的微电网在线优化[J].电测与仪表,2024,61(4):9-14.
Yu Honghui,Lin Shenghong,Zhu Jianquan,Chen Haowu.On-line optimization of micro grid based on deep reinforcement learning[J].Electrical Measurement & Instrumentation,2024,61(4):9-14.
基于深度强化学习的微电网在线优化
On-line optimization of micro grid based on deep reinforcement learning
DOI:10.19753/j.issn1001-1390.2024.04.002
中文关键词:  微电网调度  Q学习  在线优化  蒙特卡洛  深度强化学习
英文关键词:microgrid dispatching, Q-learning, online optimization, Monte Carlo, deep reinforcement learning
基金项目:广东省自然科学基金资助项目(2018A0303131001),国家自然科学基金资助项目(51977081)
           
作者中文名作者英文名单位
余宏晖Yu Honghui华南理工大学 电力学院
林声宏Lin Shenghong华南理工大学 电力学院
朱建全Zhu Jianquan华南理工大学 电力学院
陈浩悟Chen Haowu华南理工大学 电力学院
摘要点击次数: 928
中文摘要:
      针对微电网的随机优化调度问题,提出了一种基于深度强化学习的微电网在线优化算法。利用深度神经网络近似状态-动作值函数,把蓄电池的动作离散化作为神经网络输出,然后利用非线性规划求解剩余决策变量并计算立即回报,通过Q学习算法,获取最优策略。为使得神经网络适应风光负荷的随机性,根据风电、光伏和负荷功率预测曲线及其预测误差,利用蒙特卡洛抽样生成多组训练曲线来训练神经网络;训练完成后,保存权重,根据微电网实时输入状态,神经网络能实时输出蓄电池的动作,实现微电网的在线优化调度。在风电、光伏和负荷功率发生波动的情况下与日前优化结果进行对比,验证了该算法相比于日前优化在微电网在线优化中的有效性和优越性。
英文摘要:
      In view of the micro-grid random optimization scheduling problem, this paper proposes an online optimization algorithm of micro-grid based on deep reinforcement learning. The deep neural network is used to approximate the state-action value function, and the action of the battery is discretized as the output of the neural network. And then, the nonlinear programming is used to solve the remaining decision variables and calculate the immediate return, and obtain the optimal strategy through the Q-learning algorithm. In order to make the neural network adapt to the randomness of wind, photovoltaic and load power, according to the wind, photovoltaic and load power prediction curves and their prediction errors, Monte Carlo sampling is used to generate multiple sets of training curves to train the neural network. After the training is completed, the weights are saved. According to the real-time input status of the micro-grid, the neural network can output the actions of the battery in real time so as to realize the online optimal dispatching of the micro-grid. Compared with day-ahead optimization results under different fluctuations of wind power, photovoltaic and load power, the effectiveness and superiority of this algorithm in online optimization of micro-grid are verified.
查看全文  查看/发表评论  下载PDF阅读器
关闭
  • 哈尔滨电工仪表研究所有限公司
  • 中国电工仪器仪表信息网
  • 中国仪器仪表学会
  • 中华人民共和国新闻出版总署
  • 中国科技期刊编辑学会
  • 黑龙江省科学技术协会
  • 编辑之家
  • 中国知网
  • 万方数据库
  • 维普网
  • 北极星电力网
  • 中华中控网
  • 网站首页
  • 期刊介绍
    • 期刊简介
    • 历任主编
    • 期刊荣誉
  • 编委会
    • 社长及主编
    • 主任委员
    • 编委名单
  • 投稿指南
    • 作者须知
    • 投稿步骤
    • 范文(规范细则)
    • 稿件处理流程
    • 著作权转让协议
  • 期刊影响力
  • 开放获取
  • 出版道德政策
    • 出版伦理声明
    • 学术不端认定和处理方法
    • 广告及市场推广
    • 同行评议流程
    • 斟误和撤回
    • 回避制度
    • 文章署名及版权转让
  • 历年目次
  • 联系我们
地址:哈尔滨市松北区创新路2000号    邮编:150028
邮箱:dcyb@vip.163.com    电话:0451-86611021;87186023
© 2012 电测与仪表    哈公网监备2301003445号
黑ICP备11006624号-1
技术支持:北京勤云科技发展有限公司