自定义博客皮肤

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据的分组和聚合 groupby agg apply

本课内容:        数据的分组和聚合                pandas groupby 方法                pandas agg 方法                pandas apply 方法        案例讲解               鸢尾花案例   ...

2017-11-19 19:28:37

阅读数 515

评论数 0

kaggle系列(一、Titanic入门比赛)

Table of Contents 1  背景介绍2  数据导入与分析 2.1  导入有用的包2.2  导入数据2.3  去除离群点2.4  连接训练数据和测试数据2.5  查看缺失值 3  特征分析与数据前处理 3.1  数值变量 3.1.1  Explore SibSp featu...

2017-11-15 16:54:45

阅读数 2404

评论数 0

浅述python中argsort()函数的用法

浅述python中argsort()函数的用法     由于想使用python用训练好的caffemodel来对很多图片进行批处理分类,学习过程中,碰到了argsort函数,因此去查了相关文献,也自己在python环境下进行了测试,大概了解了其相关的用处,为了怕自己后面又忘了,就写下来权...

2017-11-14 21:37:39

阅读数 202

评论数 0

kaggle比赛模型融合指南

介绍 集成模型是一种能在各种的机器学习任务上提高准确率的强有力技术。在这篇文章中,我会分享我在Kaggle比赛中的集成方法。 在第一部分中,我们会讨论从提交文件中建立集成。主要包括: 投票集成平均排名平均 第二部分我们会讨论 通过 generalization/blendi...

2017-11-13 18:27:46

阅读数 900

评论数 0

pandas中利用get_dummies()进行独热编码(One-Hot encoding)

在机器学习分类任务中,经常存在一个特征有多个分类变量值,例如在kaggle中的Titanic比赛数据中,Embarked的值有S,C,Q。我们这个时候要对离散型数据进行onehot编码处理,至于onehot编码的优点以及为什么要用onehot编码?可以参考这篇博文:数据预处理:独热编码(One-H...

2017-11-11 20:57:46

阅读数 16474

评论数 2

所涉及到的几种 sklearn 的二值化编码函数:OneHotEncoder(), LabelEncoder(), LabelBinarizer(), MultiLabelBinarizer()

转自http://blog.csdn.net/haramshen/article/details/53169963 所涉及到的几种 sklearn 的二值化编码函数:OneHotEncoder(), LabelEncoder(), LabelBinarizer(), MultiLabelBi...

2017-11-11 20:15:23

阅读数 5619

评论数 2

matplotlib的一些基本设置的记录

matplotlib的一些基本设置的记录 Matplotlib可能是Python 扩展包中仅有的最流行的 2D 绘图库。她不仅提供了快速的方式可视化Python中的数据,而且提供流行的图形格式的选择。 pyplot 是非常接近 Matlab 的一个函数库,承担了大部分的绘图...

2017-11-05 14:41:28

阅读数 1745

评论数 0

安装xgboost过程中的一些坑

一般的数据挖掘比赛都需要用到xgboost,于是按照网上的教程在自己的Windows上安装xgboost包,多次安装不成功,里面有一些坑记录一下。 安装教程网上很多,也可以直接参考官方文档,我主要参考的教程是下面的博客,在此不再赘述http://blog.csdn.net/sb19931201/...

2017-11-03 16:47:13

阅读数 1638

评论数 0

关于jupyter notebook安装成功后网页无法访问的问题

笔者在安装了jupyter之后,在终端输入jupyter notebook之后,浏览器被启动但网页无法正常访问,仔细看了一下出错内容,提示主要是TemplateAssertionError: no filter named 'format_number。          网上找了各种资料,...

2017-11-02 22:00:59

阅读数 7604

评论数 0

提示
确定要删除当前文章?
取消 删除