1.7机器学习复习

机器学习:

机器学习结论->总结方法,这个过程和人是相反的。

1,监督式学习:e-mail(垃圾邮件的屏蔽)图像识别(实时获取信息)
2,非监督式学习:将用户进行分类,上面是将信息进行分类。

常用黑箱算法:
svm , model_selection(原来是cross_validation但是被弃用了,主要用它的test_split方法来进行一些数据的训练。)

或者直接去 scikit-learn 去 algorithm cheat-sheet

sklearn中digits手写字体数据集介绍在结合svm使用

import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn import svm

num=datasets.load_digits()
#sklearn中digits手写字体数据集介绍

black_box=svm.SVC(gamma=0.001,C=100)
#参数:gamma=0.001,C=100
X,y=num.data[:-888],num.target[:-888]
black_box.fit(X,y)
print(black_box.predict([num.data[-333]]))
plt.imshow(num.images[-333])
plt.show()

gamma和C参数介绍
C是惩罚力度,gamma越大的时候点越远影响越大。

简单的一个线性回归:

# -*- coding: utf-8 -*-
"""
Spyder Editor

This is a temporary script file.
"""

import matplotlib.pyplot as plt
from sklearn import datasets
from matplotlib import style
from sklearn import svm
import numpy as np
style.use('ggplot')
from sklearn import svm

X=np.array([[1,2],[3,4],
           [2,2],[10,12],
           [11,22],[21,22]])

y=[0,0,0,1,1,1]
black_box=svm.SVC(kernel='linear',C=1.0)
black_box.fit(X,y)
#方法fit的输入参数包含数据和标签。数据是x,标签是y
#print(black_box.predict([[15,17]]))

w=black_box.coef_[0]
#print(w)
a=-w[0]/w[1]
#斜率
xx=np.linspace(0,23)
#等距函数
yy=a*xx-black_box.intercept_[0]/w[1]
#y=k*x-b
#coef 和 intercept 分别是线性回归和逻辑回归
H=plt.plot(xx,yy,'r-')
plt.scatter(X[:,0],X[:,1],c=y)
plt.legend()
plt.show()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值