sklearn-教程
十三吖
这个作者很懒,什么都没留下…
展开
-
《机器学习及实战》读书笔记之基础篇(监督学习分类)
监督学习(xi,yi) 准备训练数据—>抽取特征—>训练模型—>测试—>预测对待测样本2.1.1分类学习应用:医生对肿瘤性质的判断、邮政系统对手写体邮编的识别、对新闻的分类、生物学家对物种类型的鉴定。。。。。。2.1.1.1线性分类器线性分类器是一种假设特征与分类结果存在线性关系的模型,这个模型通过累加计算每个维度的特征与各自权重的乘积来帮助分类决策。 n维特征向量原创 2018-01-29 16:39:43 · 377 阅读 · 0 评论 -
《机器学习及实战》读书笔记之基础篇(监督学习回归)
监督学习(xi,yi) 2.1.2回归预测回归问题与分类问题的区别在于:其待预测目标是连续函数2.1.2.1线性回归器m个用于训练的特征向量x=(x1,x2……xm) 其对应的回归目标y=(y1,y2……ym) 希望回归模型可以用最小二乘法来预测损失L(w,b),如此一来,线性回归器的优化目标为: argminL(w,b)=argmin((f(w,x,b)-yk)^原创 2018-02-27 15:00:04 · 267 阅读 · 0 评论 -
《机器学习及实战》读书笔记之基础篇(无监督学习)
无监督学习无标签 聚类或降维2.2.1数据聚类k均值算法1.首先,随机布设K个特征空间内的点作为初始聚类中心 2.然后,对于根据每个数据的特征向量,从K个聚类中心中寻找最近的一个,并且把该数据标记为从属这个聚类中心 3.接着,在所有的数据都被标记过聚类中心之后,根据这些数据新分配的类簇,重新对K个聚类中心进行计算 4.最后,如果一轮下来,所有数据点从属的聚类中心与上...原创 2018-03-01 08:40:37 · 442 阅读 · 0 评论 -
《机器学习及实战》读书笔记之进阶篇(模型实用技巧)
3.1模型实用技巧3.1.1特征提升特征抽取、特征筛选3.1.1.1特征抽取有些用符号表示的数据特征已经相对结构化,并且以字典这种数据结构进行存储。这时,我们使用DictVectorizer对特征进行抽取和向量化,如下代码:# -*- coding: utf-8 -*-#DictVectorizer对使用字典存储的数据进行特征抽取与向量化#定义一组字典列表,用来...原创 2018-03-13 15:01:23 · 342 阅读 · 0 评论