强化学习工程师深度实战课程
资源简介:
资源大小:1.90 GB
强化学习,又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。
课程内容从强化学习的基础到进阶实战,每个阶段都有非常详细的指导和教学,可以很好的加深同学们对强化学习框架,网络流程,运行策略的理解,从宏观到细节,特别细致,对于想要快速在工作中运用强化学习的同学很有帮助。
[强化学习工程师]强化学习工程师深度实战课程目录如下:
1-2 一张图通俗解释强化学习.mp4
1-3 强化学习的指导依据.mp4
1-4 强化学习AI游戏DEMO.mp4
1-5 应用领域简介.mp4
1-6 强化学习工作流程.mp4
1-7 计算机眼中的状态与行为.mp4
2-1 基本情况介绍.mp4
2-2 与环境交互得到所需数据.mp4
2-3 要完成的目标分析.mp4
2-4 策略梯度推导.mp4
2-5 baseline方法.mp4
2-6 OnPolicy与OffPolicy策略.mp4
2-7 importance sampling的作用.mp4
2-8 PPO算法整体思路解析.mp4
3-1 Critic的作用与效果.mp4
3-2 PPO2版本公式解读.mp4
3-3 参数与网络结构定义.mp4
3-4 得到动作结果.mp4
3-5 奖励获得与计算.mp4
3-6 参数迭代与更新.mp4
4-1 算法原理通俗解读.mp4
4-2 目标函数与公式解析.mp4
4-3 Qlearning算法实例解读.mp4
4-4 Q值迭代求解.mp4
4-5 DQN简介.mp4
5-1 整体任务流程演示.mp4
5-2 探索与action获取.mp4
5-3 计算target值.mp4
5-4 训练与更新.mp4
6-1 DoubleDqn要解决的问题.mp4
6-2 DuelingDqn改进方法.mp4
6-3 Dueling整体网络架构分析.mp4
6-4 MultiSetp策略.mp4
6-5 连续动作处理方法.mp4
7-1 AC算法回顾与知识点总结.mp4
7-2 优势函数解读与分析.mp4
7-3 计算流程实例.mp4
7-4 A3C整体架构分析.mp4
7-5 损失函数整理.mp4
8-1 整体流程与环境配置.mp4
8-2 启动游戏环境.mp4
8-3 初始化局部模型并加载参数.mp4
8-4 要计算的指标回顾.mp4
8-5 与环境交互得到训练数据.mp4
8-6 训练网络模型.mp4
9-1 卷积神经网络应用领域.mp4
9-10 VGG网络架构.mp4
9-11 残差网络Resnet.mp4
9-12 感受野的作用.mp4
9-2 卷积的作用.mp4
9-3 卷积特征值计算方法.mp4
9-4 得到特征图表示.mp4
9-5 步长与卷积核大小对结果的影响.mp4
9-6 边缘填充方法.mp4
9-7 特征图尺寸计算与参数共享.mp4
9-8 池化层的作用.mp4
9-9 整体网络架构.mp4
10-1 PyTorch框架发展趋势简介.mp4
10-2 框架安装方法(CPU与GPU版本).mp4
10-3 PyTorch基本操作简介.mp4
10-4 自动求导机制.mp4
10-5 线性回归DEMO-数据与参数配置.mp4
10-6 线性回归DEMO-训练回归模型.mp4
10-7 常见tensor格式.mp4
10-8 Hub模块简介.mp4
11-1 卷积网络参数定义.mp4
11-10 加载训练好的网络模型.mp4
11-11 优化器模块配置.mp4
11-12 实现训练模块.mp4
11-13 训练结果与模型保存.mp4
11-14 加载模型对测试数据进行预测.mp4
11-15 额外补充-Resnet论文解读.mp4
11-16 额外补充-Resnet网络架构解读.mp4
11-2 网络流程解读.mp4
11-3 Vision模块功能解读.mp4
11-4 分类任务数据集定义与配置.mp4
11-5 图像增强的作用.mp4
11-6 数据预处理与数据增强模块.mp4
11-7 Batch数据制作.mp4
11-8 迁移学习的目标.mp4
11-9 迁移学习策略.mp4
评论0