自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Emily

流泪撒种的,必欢呼收割~

原创 pandas将日期转换成timestamp

OUTLINE 常见的时间字符串与timestamp之间的转换 日期与timestamp之间的转换 常见的时间字符串与timestamp之间的转换 这里说的字符串不是一般意义上的字符串,是指在读取日期类型的数据时,如果还没有及时解析字符串,它就还不是日期类型,那么此时的字符串该怎么与时间...

2018-06-14 14:29:59

阅读数 13020

评论数 3

原创 pandas去除重复列

OUTLINE 数据准备 问题描述 解决方案 数据准备 假设我们目前有两个数据表: ① 一个数据表是关于三个人他们的id以及其他的几列属性信息 import pandas as pd import numpy as np data = pd.DataFrame(np.random...

2018-06-13 11:17:37

阅读数 8963

评论数 1

原创 diff函数

OUTLINE 问题场景 解决方案 问题场景 假设我有一份操作日志数据,其中一个特征是操作app的时间,时间结构譬如“2018-03-13 23:26:19”,我想知道上一次操作跟下一次操作的间隔时间是多少? 解决方案 关于某列或者某行数据的差分自然要想到python中的...

2018-06-11 16:15:41

阅读数 5069

评论数 0

原创 python中的filter、map、reduce、apply用法总结

这几个函数在平时使用时不能立即想起来,而且它们之间区别不清,借该文做个总结。 OUTLINE filter map reduce apply 总结 filter 功能: filter的功能是过滤掉序列中不符合函数条件的元素,当序列中要删减的元素可以用某些函数描述时,就应该想起filt...

2018-06-09 16:19:42

阅读数 9353

评论数 3

原创 交叉验证——对数据集的划分

写在前面: 为什么划分数据集? 以我们的比赛为例,赛方提供有标签的训练数据和无标签的测试数据,要求我们提交测试数据的预测标签值,如果我们不划分数据集,直接用所有的数据进行训练,最后直接对无标签的测试数据预测,我们很难预测我们模型的好坏。以我的理解来看,对于数据集划分形成的验证集,相当于是平时...

2018-06-07 20:19:36

阅读数 3523

评论数 0

转载 主流机器学习模型模板代码+经验分享[xgb, lgb, Keras, LR]

(本文为转载) 摘要 最近打各种比赛,在这里分享一些General Model,稍微改改就能用的 环境: python 3.5.2 XGBoost调参大全: http://blog.csdn.net/han_xiaoyang/article/details/52665396 XGBoo...

2018-06-07 10:24:02

阅读数 527

评论数 0

原创 python爬虫资料汇总

1、崔应才老师的博客 里面包含四个系列:爬虫入门、爬虫实战、爬虫利器和爬虫进阶。 最棒的是里面对各个爬虫相关的库做了详细的介绍。 2、天善学院崔老师的课程:爬虫三大案例实战 里面包含三个案例: 分析Ajax抓取今日头条街拍美图 Requests+正则表达式抓取猫眼电影TOP100 S...

2018-06-07 09:59:47

阅读数 121

评论数 0

原创 MySQL said: Authentication plugin 'caching_sha2_password' cannot be loaded...

OUTLINE 问题描述 解决方案 问题描述 在mac下,用sequel pro连接数据库,出现以下问题: MySQL said: Authentication plugin ‘caching_sha2_password’ cannot be loaded: dlopen(...

2018-06-06 15:57:57

阅读数 1663

评论数 0

原创 Python中的groupby分组

写在前面:之前我对于groupby一直都小看了,而且感觉理解得不彻底,虽然在另外一篇文章中也提到groupby的用法,但是这篇文章想着重地分析一下,并能从自己的角度分析一下groupby这个好东西~ OUTLINE 根据表本身的某一列或多列内容进行分组聚合 通过字典或者Serie...

2018-06-05 21:02:03

阅读数 34288

评论数 7

原创 Python中随机数的生成

在Python中可以用于随机数生成的有两种主要途径,一是random模块,另一个是numpy库中random函数。 OUTLINE random模块 numpy中的random函数 总结 random模块 random模块中将近有7个函数都是可以用来生成随机数的: ① rando...

2018-06-05 16:50:42

阅读数 6191

评论数 0

原创 Vlookup

写在前面:接着上一篇的数据透视表的内容,这篇着眼于Excel的Vlookup函数。 OUTLINE 什么是Vlookup Vlookup怎么用 适用场景 什么是Vlookup Vlookup从它的功能上来看,就是为了查找表格中的内容;从它的使用上来看,本质上是一个函数,只要...

2018-06-04 21:48:02

阅读数 854

评论数 0

原创 CSDN中上传GIF图片

环境:mac系统 软件:licecap(一个非常好用的mac录屏软件) 网盘密码:9lth 效果:

2018-06-04 16:33:24

阅读数 367

评论数 2

提示
确定要删除当前文章?
取消 删除