分类
。难悟易误。
这个作者很懒,什么都没留下…
展开
-
2.1.1.1 线性分类器
import pandas as pdimport numpy as np#创建特征列表column_names=['sample code number','clump thickness','uniformity of cell size', \'uniformity of cell shape','marginal adhesion','single epithelical cell...原创 2019-02-28 22:52:38 · 243 阅读 · 0 评论 -
2.1.1.2 支持向量机(分类)(手写体识别)
import pandas as pdimport numpy as np#导入手写体数字加载器from sklearn.datasets import load_digits#获得手写体数字的数码图像数据,存储在digits变量中digits=load_digits()digits.data.shape#共有1797条,每幅图片由8*8=64的像素矩阵表示from sklea...原创 2019-03-01 18:57:51 · 292 阅读 · 0 评论 -
2.1.1.3 朴素贝叶斯(新闻数据分类)
#导入新闻数据抓取器from sklearn.datasets import fetch_20newsgroups#即时从互联网下载数据news=fetch_20newsgroups(subset='all')#共有18846条新闻len(news.data)#第一条数据news.data[0]from sklearn.cross_validation import trai...原创 2019-03-01 19:41:34 · 176 阅读 · 0 评论 -
2.1.1.4 K 近邻(分类)
#导入 iris 数据加载器from sklearn.datasets import load_irisiris=load_iris()#查看数据规模iris.data.shape#查看数据说明print(iris.DESCR)#数据分割from sklearn.cross_validation import train_test_splitX_train,X_test,...原创 2019-03-01 22:15:14 · 118 阅读 · 0 评论 -
2.1.1.5 决策树(分类)
import pandas as pdtitanic=pd.read_csv('http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic.txt')观察前几行的数据,发现数据种类各异,有数值型,类别型,还有缺失数据titanic.head()#查看数据的统计特性,1313条乘客信息titanic.info()...原创 2019-03-02 10:41:42 · 237 阅读 · 0 评论 -
2.1.1.6 集成模型(分类)
import pandas as pdtitanic=pd.read_csv('http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic.txt')#数据预处理#特征选择X=titanic[['pclass','age','sex']]y=titanic['survived']#查看特征统计信息,发现age列...原创 2019-03-02 19:50:28 · 348 阅读 · 0 评论 -
XGBoost 模型(分类)
import pandas as pdtitanic=pd.read_csv('http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic.txt')X=titanic[['pclass','age','sex']]y=titanic['survived']X['age'].fillna(X['age'].mean(),i...原创 2019-03-13 20:05:24 · 2034 阅读 · 0 评论 -
模型实战:titannic (分类)(xgboost)(超参数搜索)
import pandas as pd#本地读取训练集和测试集train=pd.read_csv('train.csv')test=pd.read_csv('test.csv')#输出基本信息print(train.info())print(test.info())selected_features=['Pclass','Sex','Age','Emarked','SibSip','...原创 2019-03-13 20:46:49 · 1406 阅读 · 0 评论