深度学习之“无监督强化学习”

上传人 :曼孚科技
时间 :2021年12月27日

深度学习之“无监督强化学习”

随着5G时代的到来与中国企业数字化进程的加快,人工智能领域不断突破创新,机器学习、深度学习等名词也愈加频繁出现在大众视野中。机器学习作为人工智能的核心,是实现人工智能的方法,也是使计算机拥有智能的根本途径。深度学习是机器学习领域中一个新的研究方向,是实现机器学习的重要技术支撑。

深度学习是以建立、模拟人脑进行分析学习的神经网络为架构,利用模仿人脑机制对数据进行表征学习的一种算法。无监督学习、监督学习与强化学习是它的三个领域。其中,无监督学习是从大量无注释数据中学习的过程;监督学习是从中等数量带有注释的数据中学习的过程;强化学习是从奖励信号中学习的过程(这些奖励以少量数据的形式给出)。而将无监督学习运用到强化学习中可大幅度提升强化学习效率。无监督学习可从大量的数据中学习概率分布,实现从过去到未来的预测,在强化学习中该模型可帮助机器自主“思考”并赚取奖励并加速强化学习的任务执行速度。

目前无监督学习与强化学习结合的技术已应用广泛,由Deep Mind开发的虚幻引擎( Unreal )利用强化学习与变分自动编码器在各种游戏中提高性能水平。 Google Brain的世界模型可以在无监督的方式下快速训练,使用变分自动编码器学习各种环境数据。CURL(强化学习的对比无监督表示),使用对比学习从原始信息中提取高级特征,并对提取的特征进行强化学习。