机器学习
千码君2016
高级软件研发工程师,云计算网络虚拟化技术专家
展开
-
05-《机器学习及实战》学习之支持向量机分类
支持向量:真正帮助决策最优线性分类模型的数据点(注意是点)。何为支持向量,说白了就是一大堆决策之中最靠谱的那个!使用支持向量机(分类)对手写体数字图像进行识别:# -*- coding: UTF-8 -*-#1、手写体数据读取代码样例#从sklearn.datasets里面导入手写体数字加载器from sklearn.datasets import load_digits#从通过数据加载器...原创 2018-03-22 23:20:04 · 335 阅读 · 0 评论 -
06-《机器学习及实战》之朴素贝叶斯分类模型
朴素贝叶斯:单独考量每一维度特征被分类的条件概率,进而综合这些概率并对其所在的特征向量做出分类预测。说白了:不要被他吓到了亲。我的理解是,牧场里面目前有3头牛、5匹马、7只羊还有9条狗。那么这个牧场可以私以为分为四个维度(当然这有些太明确了),然后呢随便挑出一个计算他在每一个维度里面的概率来极尽可能的采集这个维度的特征值,然后综合考量之后对后来加入的或者是一头牛或者是一只羊又或者是一只鸡进行合理的...原创 2018-03-22 23:42:15 · 244 阅读 · 0 评论 -
07-《机器学习及实战》学习之K近邻分类模型
k近邻分类模型:无参数,计算每个对每个训练样本采取遍历的方法与测试样本逐一计算相似度、排序并且选择K个临近训练样本的标记进而做出分类决策。比如说20个西瓜,拿出3个做训练样本。从另外17个测试样本西瓜中选择一个标记点,从这个标记点向外第一次取5个算上标记值就是六个如果这个六个其中4个西瓜和训练样本中的A西瓜更像,就做一次总结,以此类推。也就是说这个分类方法会逐渐的缩小类别范围,尽可能的分类到最小的...原创 2018-03-23 00:17:36 · 279 阅读 · 0 评论 -
01-《机器学习及实践》学习之数据预处理
#0 -*- coding: UTF-8 -*-#导入工具包,做数据预处理import pandas as pdimport numpy as np#创建特征列表colum_names=['Sample code number', 'Clump Thickness', 'Uniformity of Cell Size', ...原创 2018-03-20 21:43:15 · 343 阅读 · 0 评论 -
02-《机器学习及实践》学习之数据训练,测试数据
#由于原始数据没有提供对应的测试样本用于评估模型性能,#因此需要对带有标记的数据进行分割。通常情况下,25%的数据会作为测试集,其余75%的数据用于训练,如代码#准备良/恶性乳腺癌肿瘤训练、测试数据。#from sklearn.cross_validation import train_test_split #用于分割数据。from sklearn.model_selection imp...原创 2018-03-20 21:46:57 · 639 阅读 · 0 评论 -
03-《机器学习及实践》学习之使用线性分类模型
#使用线性分类模型从事良、恶性肿瘤任务分析#标准化数据from sklearn.preprocessing import StandardScalerfrom sklearn.linear_model import LogisticRegressionfrom sklearn.linear_model import SGDClassifier#保证每个维度的特征数据方差为1,均值为0...原创 2018-03-20 21:53:49 · 199 阅读 · 0 评论 -
04-《机器学习及实战》系数截距的绘图体验
# -*- coding: UTF-8 -*-import matplotlib.pyplot as pltimport pandas as pddf_train = pd.read_csv('D:\\Python2713\\Datasets\\Breast-Cancer\\breast-cancer-train.csv')df_test = pd.read_csv('D:\\Python...原创 2018-03-20 22:03:47 · 395 阅读 · 0 评论