什么是机器学习
机器学习相关的链接
- Machine Learning_魏晓蕾的博客-CSDN博客前辈们做的机器学习笔记
- 神经网络与深度学习-邱锡鹏
- 数学基础、机器学习
- 《动手学深度学习》 — 动手学深度学习 2.0.0-beta0 documentation (d2l.ai)
- 機器學習基石(Machine Learning Foundations) 机器学习基石 课后习题链接汇总_Mac Jiang的博客-CSDN博客
如何学习
好了废话不多说,我们进入入门阶段的正题。入门阶段主要有三个任务:
- 快速看完周志华的《西瓜书》;
- 看吴恩达 Coursera 上的《机器学习》;
- 调包跑算法。
什么是机器学习
机器学习算法主要的两种类型被称之为监督学习和无监督学习。
监督学习
- 监督学习 就是我们给学习算法的一个数据集。这个数据集由“正确答案”组成 。在这个例子中,我们给出了一系列房子的数据,从给定的数据集中每个样本的真实售价,然后运用学习算法,算出更多的正确答案 。这就叫做 回归问题。
- 回归问题 就是通过离散的数据来推测出一个连续的输出。
- 分类问题 的目标是推测出一组离散的结果。
无监督学习
- 无监督学习 中没有任何标签或者所有数据的标签都是一样的。这样就不知道如何处理数据,也不知道每个数据点是什么。只知道,这是一个数据集。针对数据集,无监督学习,能够判断出数据有两个不同的聚集簇。二者不同,无监督学习算法可能会把这些数据分成两个不同的簇,所以这叫做聚类算法。可以应用的地方很多。
- 我们只有一堆数据,不知道数据中有什么东西,不知道什么人是什么类型,甚至不知道有哪几种类型,类型是什么。我们要自动的把个体会聚集到某个类。