python科学计算
1.使用python内置数据集
2.使用svm
3.拟合fit和predict
fit(X, y)
和 predict(T)
.
4.获取数组的大小——shape属性
iris.shape
得(28,19)
5.target
digits.target 就是数字数据集各样例对应的真实数字值。也就是我们的程序要学习的。
6.pickle来保存scikit中的模型
>>>import pickle
>>>s = pickle.dumps(clf)
>>>clf2 = pickle.loads(s)
7.Estimators对象
一个 estimator 可以是任意一个从数据中学习到的对象;他可能是分类算法(classification),回归算法(regression), 聚类算法(clustering),或者一个变换算法
不管他是何种算法,所有的 estimator 对象都向外部暴露了一个 fit 方法 ,该成员方法的操作对象是一个数据集
一个estimator的所有参数即可以在初始化的时候设置,也可以 按对应属性修改:
X
中的未知标签的样本,并返回预测的标签
y
.
每一个estimator暴露一个计算estimator在测试数据上的测试得分的方法: score 得分越大,estimator对数据的拟合模型越好。 .
8.KNN (k nearest neighbors) 分类器例子:
9.在python当中处理csv文件,可以使用标准库当中的csv模块。其中的writer和reader方法可以对csv文件进行读写。
import csv
rf = open('bank.csv','rb')
reader = csv.reader(rf)
此处要注意,打开一个csv文件,必须用二进制的形式打开。
此时的reader为一个迭代器,它只能使用next()和for循环。
reader.next() 返回即为第一行的内容。
要看得到所有内容,就可以使用for循环了。
for row in reader: print row
接下来,来看写入csv文件。
wf = open('bank2.csv','wb')
writer = csv.writer(wf)
writer.writerow(['id','age','sex','region','income','married','children','car','save_act','current_act','mortgage','pep'])
writer.writerow(reader.next())
10.线性回归LR
线性回归的最简单形式是通过调节一个参数集合为数据集拟合一个线性模型,使得其残差平方和尽可能小。
线性模型: