【自动驾驶】机器学习的三大类学习方法

时间:

2022-03-29

分享到:

【自动驾驶】机器学习的三大类学习方法

在如今科技高速发展的时代,人工智能正在快速跻身于人们的生产生活中,不断为经济社会的发展注入新动力,而自动驾驶又是人工智能领域里最重要的方向之一,对未来扩大驾驶人群、减少交通事故等改善人类生活方面有着举足轻重的地位。


机器学习从其诞生之日就获得了社会极大的关注,直到今天仍是工业界和学术界共同讨论的热门话题。机器学习是指利用计算机程序通过在已知经验数据中进行反复训练,旨在提高执行任务的准确性。目前可以将其分为三大类,分别是监督学习、无监督学习和强化学习。


监督学习是利用标记的数据进行训练,该学习方法分为分类和回归,分类用于离散变量的预测,而回归用于连续变量的预测。主流的监督学习算法有神经网络、K-近邻算法、决策树、朴素贝叶斯、逻辑回归。


跟监督学习方法对应,无监督学习用于未标注的数据中,该方法分为概率估计、聚类和降维。主流的无监督学习算法有K均值算法、自编码器、主成分分析。


强化学习是通过与环境交互使机器获得反馈,从而进行自动决策的方法。该方法可基于策略和值函数分为Policy based与Value based,主流的强化学习算法有Sarsa、Q-Learning、DQN、Policy-Gradient与DDPG算法。


在自动驾驶中,三种学习方法相辅相成,在实际工作中,由监督学习提供环境信息,由无监督学习进行压缩数据、可视化与去噪,强化学习则利用监督学习中的各种场景进行障碍物识别、目标跟踪、红绿灯检测识别等,从而更准确的完成规划行进路线,增强对移动目标的行为预测。