• 设为首页
  • 加入收藏
  • 联系邮箱
  • 网站首页
  • 期刊介绍
    • 期刊简介
    • 历任主编
    • 期刊荣誉
  • 编委会
    • 社长及主编
    • 主任委员
    • 编委名单
  • 投稿指南
    • 作者须知
    • 投稿步骤
    • 范文(规范细则)
    • 稿件处理流程
    • 著作权转让协议
  • 期刊影响力
  • 开放获取
  • 出版道德政策
    • 出版伦理声明
    • 学术不端认定和处理方法
    • 广告及市场推广
    • 同行评议流程
    • 斟误和撤回
    • 回避制度
    • 文章署名及版权转让
  • 历年目次
  • 联系我们
  • English
站内检索    
 
王丙文,付明,黄堃.基于强化学习的多园区综合能源系统经济调度[J].电测与仪表,2024,61(9):32-39.
WANG Bingwen,FU MING,HUANG Kun.Economic dispatch of multi-area integrated energy system based on reinforcement learning[J].Electrical Measurement & Instrumentation,2024,61(9):32-39.
基于强化学习的多园区综合能源系统经济调度
Economic dispatch of multi-area integrated energy system based on reinforcement learning
DOI:10.19753/j.issn1001-1390.2024.09.004
中文关键词:  多园区综合能源系统  实时经济调度  强化学习  多智能体近端策略优化
英文关键词:multi-area integrated energy system, real-time economic dispatch, reinforcement learning, multi-agent proximal policy optimization
基金项目:国家重点研发计划资助(2018YFB0905000)
        
作者中文名作者英文名单位
王丙文WANG Bingwen南瑞集团有限公司(国网电力科学研究院)
付明FU MING南瑞集团有限公司(国网电力科学研究院)
黄堃HUANG Kun南瑞集团有限公司(国网电力科学研究院)
摘要点击次数: 431
中文摘要:
      多园区综合能源系统中新能源出力与负荷的波动性以及多种能量之间的耦合关系,给多园区综合能源系统的优化调度带来诸多挑战。为此提出一种基于数据驱动的多智能体近端策略优化(multi-agent proximal policy optimization,MAPPO)多园区综合能源系统经济调度方法。文章综合考虑园区间的能量交易与碳市场交易,以园区日运行成本最小为目标,建立多园区综合能源系统实时优化调度模型;将该优化问题建模为马尔科夫决策过程,并设计状态空间、动作空间以及奖励函数,通过大量历史数据的训练得到多园区综合能源系统优化调度神经网络模型,实现多园区分散式实时优化调度。仿真结果表明:在新能源出力与负荷随机性波动影响下,所提方法能够在降低各园区运行成本的同时减少园区间的信息交互,有助于提高各园区隐私信息的安全性。
英文摘要:
      Due to the fluctuation of renewable energy output and load in multi-area integrated energy system, as well as the coupling relationship among multi-energy, it brings many challenges to the real-time optimal scheduling of multi-zone integrated energy system. To this end, this paper proposes a data-driven based multi-agent proximal policy optimization (MAPPO) algorithm for economic dispatch method of multi-area integrated energy system. Considering the energy trading and carbon market trading between areas, a real-time optimal scheduling model of multi-area integrated energy system is established to minimize the daily operating cost of the area. The optimization problem is modeled as a Markov decision process, and the state space, action space and reward function are designed. Through a large number of historical data training, the optimization scheduling neural network model of multi-area integrated energy system is obtained to realize multi- area decentralized real-time optimal scheduling. The results show that, under the influence of random fluctuations of new energy output and load, the proposed method can reduce the operating cost of each area, as well as the information interaction, which helps to improve the security of private information in each area.
查看全文  查看/发表评论  下载PDF阅读器
关闭
  • 哈尔滨电工仪表研究所有限公司
  • 中国电工仪器仪表信息网
  • 中国仪器仪表学会
  • 中华人民共和国新闻出版总署
  • 中国科技期刊编辑学会
  • 黑龙江省科学技术协会
  • 编辑之家
  • 中国知网
  • 万方数据库
  • 维普网
  • 北极星电力网
  • 中华中控网
  • 网站首页
  • 期刊介绍
    • 期刊简介
    • 历任主编
    • 期刊荣誉
  • 编委会
    • 社长及主编
    • 主任委员
    • 编委名单
  • 投稿指南
    • 作者须知
    • 投稿步骤
    • 范文(规范细则)
    • 稿件处理流程
    • 著作权转让协议
  • 期刊影响力
  • 开放获取
  • 出版道德政策
    • 出版伦理声明
    • 学术不端认定和处理方法
    • 广告及市场推广
    • 同行评议流程
    • 斟误和撤回
    • 回避制度
    • 文章署名及版权转让
  • 历年目次
  • 联系我们
地址:哈尔滨市松北区创新路2000号    邮编:150028
邮箱:dcyb@vip.163.com    电话:0451-86611021;87186023
© 2012 电测与仪表    哈公网监备2301003445号
黑ICP备11006624号-1
技术支持:北京勤云科技发展有限公司