【自动驾驶】机器学习的三大类学习方法

时间：

2022-03-29

分享到：

在如今科技高速发展的时代，人工智能正在快速跻身于人们的生产生活中，不断为经济社会的发展注入新动力，而自动驾驶又是人工智能领域里最重要的方向之一，对未来扩大驾驶人群、减少交通事故等改善人类生活方面有着举足轻重的地位。

机器学习从其诞生之日就获得了社会极大的关注，直到今天仍是工业界和学术界共同讨论的热门话题。机器学习是指利用计算机程序通过在已知经验数据中进行反复训练，旨在提高执行任务的准确性。目前可以将其分为三大类，分别是监督学习、无监督学习和强化学习。

监督学习是利用标记的数据进行训练，该学习方法分为分类和回归，分类用于离散变量的预测，而回归用于连续变量的预测。主流的监督学习算法有神经网络、K-近邻算法、决策树、朴素贝叶斯、逻辑回归。

跟监督学习方法对应，无监督学习用于未标注的数据中，该方法分为概率估计、聚类和降维。主流的无监督学习算法有K均值算法、自编码器、主成分分析。

强化学习是通过与环境交互使机器获得反馈，从而进行自动决策的方法。该方法可基于策略和值函数分为Policy based与Value based，主流的强化学习算法有Sarsa、Q-Learning、DQN、Policy-Gradient与DDPG算法。

在自动驾驶中，三种学习方法相辅相成，在实际工作中，由监督学习提供环境信息，由无监督学习进行压缩数据、可视化与去噪，强化学习则利用监督学习中的各种场景进行障碍物识别、目标跟踪、红绿灯检测识别等，从而更准确的完成规划行进路线，增强对移动目标的行为预测。

返回列表