ML 学习(一)

目录

1.ML主要分为5类

2.安装

3.如何选择机器学习的方法

4.通用学习模式

5.sklearn 的 datasets 数据库


看莫烦老师视频,自己做个笔记,记录下学习过程,希望有所收获,视频地址

https://www.bilibili.com/video/av17003173


1.ML主要分为5类

监督学习(SUPERVISED LEARNING)    有数据有标签,例如:回归/决策树/随机森林/k-近邻算法/罗辑回归

非监督学习(UNSUPERVISED LEARNING)     有数据没有标签,例如:关联算法/k-均值算法

监督学习和非监督学习结合的半监督学习

强化学习(REINFORCEMENT LEARNING)  从经验中总结提升,例如马尔科夫决策过程

遗传算法(GENETIC ALGORITHM)   和强化学习蕾类似,适者生存,不适者淘汰

常见的机器学习算法名单:

1.线性回归

2.逻辑回归

3.决策树

4.SVM

5.朴素贝叶斯

6.K近邻算法

7.K均值算法

8.随机森林算法

9.降维算法

10.Gradient Boost 和 Adaboost 算法

2.安装

需要用到python 里的  scikit-learn 模块

前置条件:

  • Python (>=2.6 or >=3.3)
  • NumPy(>= 1.6.1)
  • SciPy(>= 0.9)

安装 scikit-learn 

pip install -U scikit-learn    #-U 代表更新,第一次安装不需要-U

conda install scikit-learn

 

3.如何选择机器学习的方法

图来源:http://scikit-learn.org/stable/tutorial/machine_learning_map/index.html

4.通用学习模式

5.sklearn 的 datasets 数据库

使用真实数据来学习

from sklearn import datasets
from sklearn.linear_model import LinearRegression

loaded_data = datasets.load_boston()
data_X = loaded_data.data
data_y = loaded_data.target

model = LinearRegression()
model.fit(data_X, data_y)

print(model.predict(data_X[:4, :]))
print(data_y[:4])

 

打印结果如下,存在误差, 需要各种大量数据,参数的调节去完善学习的模型

创造一些数据来进行学习

from sklearn import datasets
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt

X, y = datasets.make_regression(n_samples=100, n_features=1, n_targets=1, noise=10)
plt.scatter(X, y)
plt.show()

可以生成如下数据,通过调整参数,生成各种数据来进行测试学习

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值