这是我学习吴恩达机器学习课程的一点心得和笔记,梳理一下知识,同时与大家交流一下。

监督学习(Supervised Learning)

在监督学习中,通过给定的数据集来得出一个最优的预测算法,在这个数据集中,我们已经知道了正确的输出。
例如:我们给出一组关于房价的数据集,数据集中包含房子的一些特征以及这些房子的价格,房子的价格即是正确的输出。

监督学习可以分为回归分类

回归问题,是在连续的输出上预测结果,通常是用一个连续函数(例如一次函数或多次函数)来拟合数据,它可能的输出值无限的。
例子:

  • 根据房子面积和位置预测房价;

而分类问题,通常是通过离散的输出,来拟合数据,它和回归的区别是,分类预测的结果是有限的,可能就两个,三个可能的结果。
例子:

  • 预测房子卖不卖的出去;
  • 预测一个肿瘤患者,他的肿瘤是恶性还是良性的;
  • 判断垃圾邮件

非监督学习(Unsupervised Learning)

无监督学习是在不知道结果是什么的情况下处理问题,可以根据数据中变量的关系对数据进行聚类,从而得出一个算法
即让机器自己学会做事情,区分数据。

无监督学习有两类算法:聚类(Clustering)非聚类(Non-clustering)

聚类:

  • 收集大量基因数据,找到一种方法将基因分组,这些分组与数据中的不同变量有关,类似,寿命,性别等;
  • 自动将大量新闻分类,分成,体育,娱乐等分类

非聚类:

  • 鸡尾酒会算法,在混乱的环境中找出结构(即在一个鸡尾酒会上从一个混合的声音中识别出人声和音乐)。