机器学习笔记
Invictus_Y
这个作者很懒,什么都没留下…
展开
-
使用线性分类模型从事良/恶性肿瘤预测任务
#-*- coding: utf-8 -*-# 导入pandas 与 numpy工具包import pandas as pdimport numpy as np# 创建特征列表column_names = ['Sample code number', 'Clump Thickness', 'Uniformity of Cell Size', 'Uniformity of Cell Shape'原创 2017-09-13 23:41:49 · 612 阅读 · 0 评论 -
使用支持向量机(分类)对手写体数字图像进行识别
手写体数据读取代码样例# 从sklearn.datasets里导入手写体数字加载器from sklearn.datasets import load_digits# 从通过数据加载器获得手写体数字的数码图像数据并储存在digits变量中digits = load_digits()# 检视数据规模和特征维度print(digits.data.shape) 手写体数据分割代码样例# 使用sk原创 2017-09-15 11:29:19 · 4820 阅读 · 0 评论 -
使用朴素贝叶斯分类器对新闻文本数据进行类别预测
读取20类新闻文本的数据细节# 从sklearn.datasets里导入新闻数据抓取器fetch_20newsgroupfrom sklearn.datasets import fetch_20newsgroups# 与之前预存的数据不同,fetch_20newsgroup需要即时从互联网下载数据news = fetch_20newsgroups(subset='all')# 查验数据规模和原创 2017-09-15 13:20:08 · 5143 阅读 · 0 评论 -
使用K近邻分类器对鸢尾花数据进行类别预测
读取20类新闻文本的数据细节# 从sklearn.datasets里导入新闻数据抓取器fetch_20newsgroupfrom sklearn.datasets import fetch_20newsgroups# 与之前预存的数据不同,fetch_20newsgroup需要即时从互联网下载数据news = fetch_20newsgroups(subset='all')# 查验数据规模和原创 2017-09-15 14:22:40 · 1215 阅读 · 0 评论 -
使用决策树模型预测泰坦尼克号乘客的生还情况
泰坦尼克号乘客数据查验# 导入pandas用于数据分析import pandas as pd# 利用pandas的read_csv模块直接从互联网收集泰坦尼克乘客数据titanic = pd.read_csv('http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic.txt')# 观察前几行数据,可以发现,数据种类各异,数原创 2017-09-16 08:30:41 · 2276 阅读 · 0 评论 -
集成模型(分类)对泰坦尼克号乘客是否生还的预测
集成模型(分类)对泰坦尼克号乘客是否生还的预测# 导入pandas,并且重命名为pdimport pandas as pd# 通过互联网读取泰坦尼克乘客档案,并存储在变量titanic中titanic = pd.read_csv('http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic.txt')# 人工选取pclass原创 2017-09-16 09:26:28 · 1064 阅读 · 0 评论 -
使用线性回归模型LinearRegression和SGDRegressor分别对美国波士顿地区房价进行预测
美国波士顿地区房价数据描述# 从sklearn.datasets导入波士顿房价数据读取器from sklearn.datasets import load_boston# 从读取房价数据存储在变量boston中boston = load_boston()# 输出数据描述print boston.DESCR美国波士顿地区房价数据分割# 从sklearn.model导入数据分割器from s原创 2017-09-16 10:18:08 · 7507 阅读 · 0 评论 -
使用三种不同核函数配置的支持向量机(回归)模型对美国波士顿地区房价进行预测
对美国波士顿地区房价数据进行预处理# 从sklearn.datasets导入波士顿房价数据读取器from sklearn.datasets import load_boston# 从读取房价数据存储在变量boston中boston = load_boston()# 输出数据描述print boston.DESCR# 从sklearn.model导入数据分割器from sklearn.mo原创 2017-09-16 14:30:41 · 3576 阅读 · 0 评论 -
使用两种不同配置的K近邻(回归)模型对美国波士顿房价数据进行回归预测
对美国波士顿地区房价数据进行预处理# 从sklearn.datasets导入波士顿房价数据读取器from sklearn.datasets import load_boston# 从读取房价数据存储在变量boston中boston = load_boston()# 输出数据描述print boston.DESCR# 从sklearn.model导入数据分割器from sklearn.mo原创 2017-09-16 15:37:53 · 1712 阅读 · 1 评论