自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Icevivian

一只刻苦专研机器学习的小可爱~

  • 博客(6)
  • 收藏
  • 关注

原创 从项目代码中学习python的更多应用

从项目代码中学习python的更多应用在kaggle的一些大赛中,kernel这部分是最有意思的,很多大神将自己的感悟发表出来供大家参考,也会贴上一些代码供大家学习。纯粹的学习python语法未免有些单调,因此在参考别人的项目代码过程中一边理解别人的算法,一边学习python语法就是一个更有趣的学习过程啦。这里我将自己的学习成果整理下来以供以后回看。 一般项目中给出的数据都是csv格式的,采...

2018-02-28 21:56:56 295 2

原创 python学习笔记(总)

Python1.内部编码与指令调试模式命令行模式:可以直接运行.py文件,但需要切换到py文件目录下 python交互模式:在命令行模式下输入python就可以进入python交互模式,它的主要作用是调试python代码,它不是正式运行python代码的环境 e.g. 在命令行模式下输入python hello.py 用Python开发程序,完全可以一边在文本编辑器里写代...

2018-02-27 16:59:45 343

原创 用python3.0实现《机器学习实战》一书的总结

因为自己开始学习Python就是使用的3.0版本,但是在学习中发现很多给出的python代码都是2.0版本,因此一直会有程序报错。这里给出自己整理的代码报错及如何改动。这里的错误代码主要来自《机器学习实战一书》1. print报错,在python3.0中,print成为了一个函数,因此print 'a',要变成print('a')2.D=map(set,dataSet); numItem...

2018-02-26 16:38:17 2452

原创 《机器学习实战》整理--无监督学习(3)

前面已经总结了监督学习中的几大算法,下面开始总结无监督学习算法。在无监督学习中,类似分类和回归中的目标变量事先并不存在,要回答的问题是“从数据X中能发现什么”,比如“构成X的最佳6个数据簇都是哪些?”或者“X中哪三个特征最频繁共现”,也就是说我们需要发现X的结构是什么。K均值(K-means) 优点:容易实现 缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢 使用数据类型:数值型数据...

2018-02-26 16:36:47 495

原创 正则表达式整理

/d:匹配一个数字,data/w:匹配一个数字或一个单词,word/s:匹配一个空格(包含tab),space/W:匹配所有非单词和下划线句点.匹配除新行符 (`r`n) 序列外的任何单个字符,*表示任意个,+表示至少一个,?表示0个或一个,{n}表示n个,{m,n}表示m~n个。句点星号模式 .* 是匹配范围最广的模式之一, 因为它可以匹配零个或多个任意字符 (除了新行符: ...

2018-02-20 22:38:25 142

原创 《机器学习实战》整理--回归算法(2)

上一篇文章介绍了监督算法中的6个分类算法,这一篇文章作为延续,讲的是监督学习中的另一种主要算法:回归算法,它的目标变量是连续数值型。线性回归 优点:结果易于理解,计算上不复杂。 缺点:对非线性的数据拟合不好 适用数据类型:数值型和标称型数据,最终算法需要的是数值型,可将标称型数据转换为二值型。 原理:寻找回归方程(回归系数),目标是使预测的y值与真实y值之间的差值最小化,采用平方误差计...

2018-02-01 17:26:54 198

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除