机器学习
qq_33361080
这个作者很懒,什么都没留下…
展开
-
使用sklearn进行数据预处理 特征选择
1.特征二元化from sklearn.preprocessing import Binarizer#设置一个threshold值 大于该值为0 小于该值为1def testBinarizer(): X = [ [1,2,3,4,5], [5,4,3,2,1], [3,3,3,3,3], [1,1,1,1,1]] ...原创 2018-09-11 08:57:04 · 974 阅读 · 0 评论 -
使用sklearn进行鸢尾花分类预测 模型:LogisticRegression
1.加载数据集 导包import numpy as npfrom sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LogisticRegressioniris=load_iris()2.切分数...原创 2018-09-11 09:14:56 · 4443 阅读 · 0 评论 -
sofasofa上的交通理赔 模型:朴素贝叶斯
1.加载数据集import pandas as pddata = pd.read_csv('train.csv')#使用dropna方法删除含有缺失值的行,默认是行 直接在原DF上进行删除 不返回data.dropna(inplace=True)#Evaluation 0表示授予理赔,1表示未通过理赔审核data.head(3)#data.info()#没有缺失值2.分割正...原创 2018-09-11 09:36:01 · 304 阅读 · 0 评论 -
使用skleran实现手写数字识别 模型:KNeighborsClassifier
1.加载数据集并分隔为特征和标签 导包import numpy as npimport matplotlib.pyplot as pltfrom sklearn import neighbors,datasets,cross_validationdef load_classification_data(): digits=datasets.load_digits() ...原创 2018-09-11 10:04:49 · 877 阅读 · 0 评论 -
使用sklearn做手写数字识别 模型:AdaBoostClassifier
1.加载数据集 导包import numpy as npimport matplotlib.pyplot as pltfrom sklearn import datasets,cross_validation,ensembledef load_classification_data(): ''' 加载分类模型使用的数据集 return 一个元组,依次为:训练样...原创 2018-09-11 10:30:28 · 2925 阅读 · 0 评论 -
使用sklearn预测波士顿房价
1.加载数据集 并切分from sklearn.datasets import load_bostonboston = load_boston()from sklearn.cross_validation import train_test_splitimport numpy as npx_train,x_test,y_train,y_test = train_test_split...原创 2018-09-11 10:42:01 · 3495 阅读 · 0 评论