reinforcement learning toolbox 产品信息 -凯发k8网页登录

 

使用强化学习设计和训练策略

强化学习智能体

使用 dqn、ppo 和 sac 等常见算法创建无模型和基于模型的强化学习智能体。或者,使用提供的模板开发您自己的自定义算法。使用 rl agent 模块将您的智能体集成到 simulink 中。

强化学习设计器

交互式设计、训练和仿真强化学习智能体。将经过训练的智能体导出到 matlab,以供进一步使用和部署。

奖励信号

创建奖励信号,衡量智能体实现目标的成功度。根据 model predictive control toolboxsimulink design optimization 中定义的控制设定自动生成奖励函数

策略表示

通过使用工具箱建议的神经网络架构快速入门。或者,浏览查找表,或使用 deep learning toolbox 层和深度网络设计器手动定义神经网络策略。

强化学习训练

通过与环境的交互或使用现有数据来训练智能体。探索单智能体和多智能体训练。记录和查看训练数据,并随时监控进度。

分布式计算

使用 parallel computing toolboxmatlab parallel server 借助多核计算机、云资源或计算集群加快训练速度。利用 gpu 加速梯度计算和预测等操作。

环境建模

使用 matlabsimulink 对与强化学习智能体无缝交互的环境进行建模。与第三方建模工具对接。

代码生成和部署

根据经过训练的策略自动生成 c/c 和 cuda 代码以部署到嵌入式设备。使用 matlab compilermatlab production server 将经过训练的策略通过独立应用程序、c/c 共享库以及其他方式部署到生产系统中。

参考示例

为机器人、自动驾驶、标定、调度和其他应用设计控制器和决策算法。借助我们的参考示例实现快速入门。

“5g 是一项关键基础架构,我们必须保护它免遭恶意攻击。reinforcement learning toolbox 使我们能够快速评估 5g 漏洞并确定缓解方法。”

ambrose kam,洛克希德·马丁公司

获取免费试用版

30 天探索触手可及。


准备购买?

获取报价并了解相关产品。

您是学生吗?

您的学校可能已拥有 campus-wide license 并允许您直接使用 matlab、simulink 和其他附加产品。

网站地图