• 设为首页
  • 加入收藏
  • 联系邮箱
  • 网站首页
  • 期刊介绍
    • 期刊简介
    • 历任主编
    • 期刊荣誉
  • 编委会
    • 社长及主编
    • 主任委员
    • 编委名单
  • 投稿指南
    • 作者须知
    • 投稿步骤
    • 范文(规范细则)
    • 稿件处理流程
    • 著作权转让协议
  • 期刊影响力
  • 开放获取
  • 出版道德政策
    • 出版伦理声明
    • 学术不端认定和处理方法
    • 广告及市场推广
    • 同行评议流程
    • 斟误和撤回
    • 回避制度
    • 文章署名及版权转让
  • 历年目次
  • 联系我们
  • English
站内检索    
 
宋涛,李丹,路宁.基于分层强化学习的数字化输电线路路径规划研究[J].电测与仪表,2022,59(4):91-97.
Song Tao,Li Dan,Lu Ning.Research of digital transmission line path planning method based on hierarchical reinforcement learning[J].Electrical Measurement & Instrumentation,2022,59(4):91-97.
基于分层强化学习的数字化输电线路路径规划研究
Research of digital transmission line path planning method based on hierarchical reinforcement learning
DOI:10.19753/j.issn1001-1390.2020.04.014
中文关键词:  数字化输电线路  路径规划  分层强化学习  MAXQ  
英文关键词:Digital transmission line  Path Planning  hierarchical reinforcement learning  MAXQ  
基金项目:国家电网公司科技项目(研综[2020]7号)
        
作者中文名作者英文名单位
宋涛Song Tao国家电网有限公司直流建设分公司
李丹Li Dan国家电网有限公司直流建设分公司
路宁Lu Ning北京道亨软件股份有限公司
摘要点击次数: 1726
中文摘要:
      在输电线路的设计中,使用三维数字化设计技术可以显著提升地形的划分精度,然而地形划分精度的提升会使得地形栅格矩阵维度呈指数级增加,导致路径规划过程中出现维度灾难问题。为解决该问题,研究了一种基于分层强化学习的数字化输电线路路径规划方法。首先建立输电线路的三维数字化云平台,再使用不同比例尺对地形数据进行重采样,将原始的地形重构为粗粒度和细粒度的两层栅格图,再使用基于MAXQ算法的分层强化学习进行路径规划,从而解决了细粒度栅格单元带来的维度灾难问题,同时又保持了精确性的优势。实际算例表明,在地形划分精度提高、传统方法无法收敛的情况下,提出的方法仍能保持收敛,并相较传统方法不合理的跨越区域更少,降低了路径规划成本。
英文摘要:
      In the domain of transmission lines design, the use of 3D digital design technology can significantly improve the fine-grained terrain division. However, the fine-grained terrain division will make the dimension of terrain grid matrix increase exponentially, which leads to the dimension disaster in the process of path planning. In order to solve the dimension disaster caused by fine-grained terrain division, a digital transmission line path planning method based on hierarchical reinforcement learning is studied. Firstly, a three-dimensional digital cloud platform for transmission lines is established. Then, different scales are used to resample the terrain data, and the original terrain is reconstructed into two layers of coarse-grained and fine-grained grid map. Then, the hierarchical reinforcement learning based on MAXQ algorithm is used for path planning, so as to solve the dimension disaster problem caused by fine-grained grid cells, while maintaining the advantage of accuracy. The practical study shows that the proposed method can still keep convergence when the accuracy of terrain division is improved and the traditional method cannot converge. Compared with the traditional method, the unreasonable crossing area is less and the cost of path planning can be reduced.
查看全文  查看/发表评论  下载PDF阅读器
关闭
  • 哈尔滨电工仪表研究所有限公司
  • 中国电工仪器仪表信息网
  • 中国仪器仪表学会
  • 中华人民共和国新闻出版总署
  • 中国科技期刊编辑学会
  • 黑龙江省科学技术协会
  • 编辑之家
  • 中国知网
  • 万方数据库
  • 维普网
  • 北极星电力网
  • 中华中控网
  • 网站首页
  • 期刊介绍
    • 期刊简介
    • 历任主编
    • 期刊荣誉
  • 编委会
    • 社长及主编
    • 主任委员
    • 编委名单
  • 投稿指南
    • 作者须知
    • 投稿步骤
    • 范文(规范细则)
    • 稿件处理流程
    • 著作权转让协议
  • 期刊影响力
  • 开放获取
  • 出版道德政策
    • 出版伦理声明
    • 学术不端认定和处理方法
    • 广告及市场推广
    • 同行评议流程
    • 斟误和撤回
    • 回避制度
    • 文章署名及版权转让
  • 历年目次
  • 联系我们
地址:哈尔滨市松北区创新路2000号    邮编:150028
邮箱:dcyb@vip.163.com    电话:0451-86611021;87186023
© 2012 电测与仪表    哈公网监备2301003445号
黑ICP备11006624号-1
技术支持:北京勤云科技发展有限公司