自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

fff2zrx的博客

云笔记本

  • 博客(11)
  • 资源 (4)
  • 收藏
  • 关注

翻译 pandas的100个tricks

最近发现kaggle上一位pandas大神总结的100个tricks,觉得有些很有用,节选了整理一些,记录于此原地址点击文章目录Trick 1: 打印出 pandas的版本和它的依赖Trick 2: 使用pandas内置的npTrick 3: 一行查看数据总体情况Trick 4: pd.read_csv()的很有用的参数加载大文件的样例数据读取指定列和指定列数据类型用header和skiprow...

2020-04-30 23:58:39 616

翻译 pandas的100个tricks(精细版)

最近发现kaggle上一位pandas大神总结的100个tricks,觉得有些很有用,https://www.kaggle.com/python10pm/pandas-100-tricks文章目录Trick 1: 一行查看数据总体情况Trick 2: pd.read_csv()中有用的参数加载大文件的样例数据读取指定列和指定列数据类型Trick 3: datetime对象可用接口Trick ...

2020-04-30 23:52:26 470

原创 使用bat脚本双击打开jupyter notebook

用惯了pycharm,所以懒得再安装anaconda,安装了jupyter notebook这个包,但每次想使用时,就要两步走win+R 输入cmd,打开命令行窗口输入jupyter notebook,然后就在浏览器里打开了实在是有点烦,天天打jupyter notebook这个单词查到了bat脚本@echo off cd C:/Users/zrxstart cmd /k ...

2020-04-25 11:26:49 2171 1

原创 datetime时间类型加减运算

python中处理时间数据,建议使用datetime类型计算时间差import datetimea=datetime.datetime.now()#some codeb=datetime.datetime.now()print((b-a).seconds)时间加减x天(小时/分钟/秒)import datetimea=datetime.datetime.now()+da...

2020-04-24 23:31:50 8833

原创 pandas之resample踩坑

之前强烈安利的pandas函数resample最近坑我不浅,记录下来一言以蔽之:它娘的会自动补全中间缺的日期背景是这样:我想按下雨工作日和周末,不下雨工作日和周末,统计按15min集计订单时变量,然后绘制这种图于是筛选好四部分数据后,依次放入下面代码所示函数中进行集计resample_data=order_data.resample('15T',on='start_time').agg...

2020-04-22 16:46:26 2901

原创 字符串时间与datetime对象相互转换

普通的字符串与datetime对象时间互相转换普通字符串==>>datetime对象strptime 格式要对应parser.parse 格式自由datetime对象==>>普通字符串strftimefrom dateutil import parserimport datetimetime_string='Thu Dec 22 12:40:...

2020-04-19 23:03:02 1447

原创 pandas之上下行运算

有时候我们需要判断相邻两行关系,比如想去除掉相邻两行某个字段相同的数据行。比如我们可以写一个循环,判断每一行与上一行的关系但是pandas已经有了现成的函数供我们使用diff函数pandas.Series.diffCalculates the difference of a Series element compared with another element in the Ser...

2020-04-17 22:56:56 6903

原创 利用C4.5算法对鸢尾花分类

文章目录数据选取和数据情况利用C4.5算法分类离散化连续变量C4.5原理C4.5实现应用训练好的决策树分类数据选取和数据情况本次实验选取鸢尾花数据集(http://archive.ics.uci.edu/ml/datasets/Iris)数据包含5列,分别是花萼长度、花萼宽度、花瓣长度、花瓣宽度、鸢尾花种类。鸢尾花属种类包含三种:iris-setosa, iris-versicolour,...

2020-04-17 20:54:06 5491 14

原创 pandas之多行按类合并为一行

前言前面讲到explode操作是把某一列中的嵌套列表拆分为多行那有时候我们会有着相反的需求,即按照某一列,把相同值对应的多行合并成一行原理主要用到groupby函数+apply函数读取数据data=pd.read_csv('data.csv',header=None)data.columns=['car_id','time','lon','lat']2. 多列合并为一列...

2020-04-05 20:43:28 16772 4

原创 快速上手python操作postgresql

前言总结下前期利用python操作postgresql数据库的笔记,方便以后使用,顺便安利markdown真舒服python上传dataframe数据入数据库主要是通过create_engine来连接数据库进行数据上传pd.to_sql上传数据是dataframe形式则不需要新建表,直接上传即可,但是数据量很大的时候就很慢用到的主要函数是df.to_sql()函数,跟df.to...

2020-04-05 17:23:58 587

原创 如何绘制频率直方图+累计概率曲线

前言matplotlib画直方图是通过hist函数来画的,但是有时候或许我们想画一个直方图加上累计概率曲线,既然没有现成的,就只能咱们自己造了计算累计曲线ax1 = fig.add_subplot(111)a1,a2,a3=ax1.hist(data,bins =10, alpha = 0.65,normed=1,edgecolor='k')a1返回的是直方图每个柱子的高度,如果...

2020-04-04 23:12:10 13090

Python代码+GMM聚类算法+决策树(C4.5)分类算法

基于鸢尾花数据实现了GMM聚类算法和决策树(C4.5)分类算法 1.GMM聚类算法python代码结合以下博客食用更佳 https://fff2zrx.blog.csdn.net/article/details/107892887 2.决策树(C4.5)分类算法python代码结合以下博客食用更佳 https://fff2zrx.blog.csdn.net/article/details/105588286

2023-07-20

mobike_beijing_geohash.rar

数据来自摩拜练习赛https://www.biendata.xyz/competition/mobike_practice/,地理位置通过Geohash加密,可以通过开源的方法获得其经纬度数据,标注数据中包含300万条出行记录数据,覆盖超过30万用户和40万摩拜单车。数据包括骑行起始时间和地点、车辆ID、车辆类型和用户ID等信息。

2020-06-16

shanghai_urban.csv

上海市各个地铁站的名称,所属线路名字,经纬度坐标,坐标是wgs84坐标系,包括部分在建,共449个地铁站;上海地铁poi

2020-05-18

双约束重力模型.rar

基于样例实现的交通分布之双约束重力分布模型, doublecon.m为运行主文件,剩下两个文件是定义的函数

2019-12-05

TensorFlow 安装whl文件

Tensorflow 在Windows下安装文件 只支持Python3.5 在Windows环境下 下载后切换cmd目录至文件所在目录,cmd中输入 pip install tensorflow-1.7.0-cp35-cp35m-win_amd64.whl

2018-04-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除