适于电力系统的深度强化学习方法探索张翔昱电气工程学院,东南大学2024年10月@江苏省电工技术学会学习辅助型优化求解模型预测控制+值函数学习(用作终端成本)学习加速型ADMM:利用循环神经网络预测ADMM的收敛轨迹可微规划(DifferentiableProgramming)利用深度学习框架(如PyTorch)求解优化问题原始-对偶可微预测控制(考虑显式约束、基于模型的策略训练)混合式算法+结合两者优势(无模型)强化学习适于电力系统的策略训练方法:全局-...