本内容整理自《斯坦福大学公开课:机器学习》,讲师为Andrew Ng。这份课程也算是这个领域的启蒙课程了。
自学机器学习(Machine Learning)的计划其实从2016年夏天就开始了,反反复复断断续续的拖着,到了这个节骨眼上实在是拖不下去了,所以一边是在这里整理知识点,一边是监督自己一直把这个公开课的内容学下去。
课程在线资源:http://cs229.stanford.edu
一、定义
1.1959. Arthur Samuel
在不直接针对问题进行编程的情况下,赋予计算机学习能力的一个研究领域。
例:西洋棋(实际上是国际跳棋)程序:计算机和自己下棋。
2.1998. Tom Mitchell
一个计算机程序,给它一个任务T(Task)和一个性能测量方法P(Performance)。如果在经验E(Experience)的影响下,P对T的结果得到了改进,那么就说该程序从E中学习。
以上面的西洋棋程序为例:
E-程序不断和自己下棋的经历
T-下棋
P-他和人类棋手对弈的表现
二、机器学习的种类
1.监督学习(Supervised Learning)
例1 房屋价格(P)与面积(S)
提供一组“正确答案”的数据,让程序通过学习来预测任意面积S所对应的价格P。
可能是线性的,也可能是对数型的,或者是其他更复杂的数学模型。
这种问题属于回归问题,本质上是预测一段连续的曲线。
例2 肿瘤大小与乳腺癌
当提供单一属性「肿瘤大小」时,是否发病的预测相对困难;
但是在我们加入“年龄”这一因素后,即可将离散的数据进行明显分类了。
图中圆圈代表良性肿瘤,叉号代表恶性肿瘤,横纵坐标分别为肿瘤的大小和该病人的年龄。
这种问题属于分类(classification)问题,本质上是离散的。
2.学习理论(Learning Theory)
我们常问的有:多少数据?多少精度?
例:一个读取信封上手写邮编的程序。
在经过机器学习达到什么程度时,我们能够保证它有99.9%的准确率?
这将在后面的课程中介绍。
3.无监督学习(Unsupervised Learning)
例1:给出一组(没有正确答案的)数据,从这些数据中找出有趣的结构。
如上图所示的聚类问题(Clustering),即是无监督学习的一个典型例子。
例2:数字图像处理中的应用
将像素点进行聚类,从而判断集群。
例3:鸡尾酒聚会问题(Cocktail Party Problem)
在一个喧闹的聚会上,将人声和环境音完全分离。
4.加强学习(Reinforcement Learning)
例:狗的训练
当狗作出一些好事时,你会给它一些奖励(如好吃的东西),反之,你会给它一些惩罚(如一顿鞭打),这样,狗就会慢慢的去多做好的事情来获得更多的奖励
「回报函数」概念:如何去定义一个积极的回报是问题的核心。
End.