策略迭代法
基本解释
简解
策略迭代法的词语属性
拼音cè lüè dié dài fǎ
拼音字母ce lve die dai fa
拼音首字母clddf
策略迭代法的百科含义
策略迭代法(policy iteration method)是动态规划中求最优策略的基本方法之一。它借助于动态规划基本方程,交替使用“求值计算”和“策略改进”两个步骤,求出逐次改进的、最终达到或收敛于最优策略的策略序列。
猜你喜欢
- lichuyi李楚益
- dichandaheng地产大亨
- taocimoguangjin陶瓷磨光金
- baishiyangshengtang白氏养生汤
- tianlongchuanqi天龙传奇
- dongfengyanyu东风宴语
- wenquxue文趣学
- xiangtonghuayiyang像童话一样
- zhongtongdaxia中通大厦
- matougang马头岗
- yuzundajiulou御樽大酒楼
- hurunzhen湖润镇
- jueduigaodu绝对高度
- xiaoansufenji小安素粉剂
- zuihoudeerzi最后的儿子
- hongfadaxia宏发大厦
- zhonghuixiaogu众毁销骨
- fantingqiang樊廷强
- zhaolingqujiaoyuju召陵区教育局
- linxiaowei林晓伟
- naluyingyuan纳鲁影院
- shenghuochayi生活茶艺
- situba司徒拔
- tongleiliaofa同类疗法
- guxiangxiang固厢乡
- gutianbeilin谷田贝凛
- jinghexiangonganju精河县公安局
- huanjideaini还记得爱你
- wenhezhaoliyu温和沼丽鱼
- guiyangxiangongshangju桂阳县工商局