元强化学习驱动的高比例分布式光伏智能配电网自适应调压技术汇报人:葛磊蛟副教授所属院校:天津大学电话&微信:138201767502024年08月目录一、元强化学习二、传统智能配电网调压技术三、基于强化学习的电压自适应控制四、元强化学习驱动的自适应电压控制元学习,也称为"学习如何学习",是一种机器学习方法,旨在通过学习多个任务的经验,提高在新任务上的学习效率。元学习的核心思想是从一组任务中提取通用的经验和知识,从而在遇到新任务时能够快速适应和学习。Agent.hoha1nd5051Episode1……MDP2………Trial2图1强化学习环境中循环元学习器的工作流程元强化学习的目标是学习一个元策略(Meta-Policy),该策略能够在不同任务上快速适应和优化。1.1元强化学习定义1.元强化学习Multi-tasklearninglearntasksperformtaskslearntolearntasksquicklylearnhoha1Meta-learning……MDP1……50S152huhsEpisode1Episode2Agent.50S1nidiTrial1nidi”ndhzhshsaia25352step1:采样阶段step2:训练阶段step3:测试阶段step4:聚合阶段step5:更新阶段1.2元强化学习原理元强化学习(Meta-ReinforcementLearning,Meta-RL)是结合元学习(Meta-Learning)和强化学习(ReinforcementLearning,RL)的一种新兴方法。它旨在通过学习如何学习,提高智能体在新任务上的适应能力和学习效率。θ₁=φθ1θ₂θi=θ₁-α₁aL(Xe⁰l₄(θ;)=L(Xg,yl4;θj)O-∑eJ(φ)1.元强化学习AcrossTaskstestingfnQuerysetAggregateLossstep5:Updateφφ=φ-B.θiθ₂SampleTasksSupportstep3:step4:stepstepl₁(θi)trainlngsetl₂(θ2)1:2:Acrossinφ←目录一、元强化学习二、传统智能配电网调压技术三、基于强化学习的自适应电压控制四、元强化学习驱动的自适应电压控制按照“集中式-分散式-分布式”的发展路径多拓扑的配电网运行方式风/光/氢等多类型能源分散无序接入2.传统智能配电网调压技术2.1国家重大需求:高质量发展智能配电网日益增强的用户高品质供电需求R民照户分散控制成本高、精度差、调控难技术路径实际困境DTEN6分布式控制集中控制变华本天mx主坪城接心网网本(ci)鑫eER1ekE电室K空换网应掏样供地大厦州户变电站基贴m304新特点分布式光伏点多面广、分散无序接入分布式光伏受光照日周期变化、云层变化、阴影效应等影响高比例分布式光伏等分布式资源海量接入导致配电网调压更加难新挑战电压越限问题严重多设备协调控制困难线路电压,特别是末端节点电压波动严重2.2智能配电网调压困境2.传统智能配电网调压技术高比例分布式光伏接入下的智能配电网电压机理复杂:呈现高维非线性、分布分散、时变性强等特征;电压波动传到特性加剧,需要统筹优化控制对象复杂:调节资源种类多,时序配合难;无功资源可调能力随机变化,有功无功耦合、精确控制难控制场景复杂:配电网架复杂,容易变化;跨多个电压等级,多个控制系统,信息交互慢;量测覆盖不全,配网模型获取困难投资成本敏感:调压设备种类多样,调压的效果差异较大等2.传统智能配电网调压技术2.2智能配电网调压困境1234配网级调压:多层级、全过程电压无功优化调度主站馈线层级:实现区域、区段协同电压控制台区层级:有限量测条件下,提升台区自治电压控制能力2.传统智能配电网调压技术2.3传统调压手段:分层分区方式设备层级:加强对系统感知,提升逆变器并网功率调节能力静止无功发生器储能装置分布式光伏充电桩2.3传统调压手段:控制方法根据电网状态对分布式光伏并网功率进行控制是调节配网电压的重要手段,结合不同的通信控制方式,电压控制策略可以分为以下三种通过本地控制器进行测算与控制,无网络通信成本。计算量小,但是不具备全局协调能力,往往作为预防控制环节通过各个子环节或子系统协同控制实现全局调节,具有一定的全局寻优能力,对整个系统通信网络性能的依赖较小2.传统智能配电网调压技术全局最优性强,但数据传输量和计算密度巨大,高度依赖发达的通信网络分布式控制集中式控制就地控制调度中心分市式光伏户用储能分布式储的站分散式风机同质光伏电动汽车北传统的调压设备在调节速度和精度上往往无法满足快速变化的光伏出力需求,特别是在光照强度急...