机器学习及实践
十三吖
这个作者很懒,什么都没留下…
展开
-
《机器学习及实战》读书笔记之简介篇
python数据类型1、数字number:整型integer、长整型long、浮点数float、复杂型数complex 2、布尔型boolean:二进制表示真和假true and false 3、字符串string:由一系列字符character组成,单引号双引号辅助表示“123”,‘123’ 4、元组tuple:元组内部数据类型不必统一,t=(123,’abc’,0.55),其中t[0原创 2018-01-27 17:28:58 · 297 阅读 · 0 评论 -
《机器学习及实战》读书笔记之基础篇(监督学习回归)
监督学习(xi,yi) 2.1.2回归预测回归问题与分类问题的区别在于:其待预测目标是连续函数2.1.2.1线性回归器m个用于训练的特征向量x=(x1,x2……xm) 其对应的回归目标y=(y1,y2……ym) 希望回归模型可以用最小二乘法来预测损失L(w,b),如此一来,线性回归器的优化目标为: argminL(w,b)=argmin((f(w,x,b)-yk)^原创 2018-02-27 15:00:04 · 267 阅读 · 0 评论 -
《机器学习及实战》读书笔记之基础篇(无监督学习)
无监督学习无标签 聚类或降维2.2.1数据聚类k均值算法1.首先,随机布设K个特征空间内的点作为初始聚类中心 2.然后,对于根据每个数据的特征向量,从K个聚类中心中寻找最近的一个,并且把该数据标记为从属这个聚类中心 3.接着,在所有的数据都被标记过聚类中心之后,根据这些数据新分配的类簇,重新对K个聚类中心进行计算 4.最后,如果一轮下来,所有数据点从属的聚类中心与上...原创 2018-03-01 08:40:37 · 442 阅读 · 0 评论 -
《机器学习及实战》读书笔记之进阶篇(模型实用技巧)
3.1模型实用技巧3.1.1特征提升特征抽取、特征筛选3.1.1.1特征抽取有些用符号表示的数据特征已经相对结构化,并且以字典这种数据结构进行存储。这时,我们使用DictVectorizer对特征进行抽取和向量化,如下代码:# -*- coding: utf-8 -*-#DictVectorizer对使用字典存储的数据进行特征抽取与向量化#定义一组字典列表,用来...原创 2018-03-13 15:01:23 · 343 阅读 · 0 评论