- 博客(11)
- 资源 (4)
- 收藏
- 关注
翻译 pandas的100个tricks
最近发现kaggle上一位pandas大神总结的100个tricks,觉得有些很有用,节选了整理一些,记录于此原地址点击文章目录Trick 1: 打印出 pandas的版本和它的依赖Trick 2: 使用pandas内置的npTrick 3: 一行查看数据总体情况Trick 4: pd.read_csv()的很有用的参数加载大文件的样例数据读取指定列和指定列数据类型用header和skiprow...
2020-04-30 23:58:39 616
翻译 pandas的100个tricks(精细版)
最近发现kaggle上一位pandas大神总结的100个tricks,觉得有些很有用,https://www.kaggle.com/python10pm/pandas-100-tricks文章目录Trick 1: 一行查看数据总体情况Trick 2: pd.read_csv()中有用的参数加载大文件的样例数据读取指定列和指定列数据类型Trick 3: datetime对象可用接口Trick ...
2020-04-30 23:52:26 470
原创 使用bat脚本双击打开jupyter notebook
用惯了pycharm,所以懒得再安装anaconda,安装了jupyter notebook这个包,但每次想使用时,就要两步走win+R 输入cmd,打开命令行窗口输入jupyter notebook,然后就在浏览器里打开了实在是有点烦,天天打jupyter notebook这个单词查到了bat脚本@echo off cd C:/Users/zrxstart cmd /k ...
2020-04-25 11:26:49 2171 1
原创 datetime时间类型加减运算
python中处理时间数据,建议使用datetime类型计算时间差import datetimea=datetime.datetime.now()#some codeb=datetime.datetime.now()print((b-a).seconds)时间加减x天(小时/分钟/秒)import datetimea=datetime.datetime.now()+da...
2020-04-24 23:31:50 8833
原创 pandas之resample踩坑
之前强烈安利的pandas函数resample最近坑我不浅,记录下来一言以蔽之:它娘的会自动补全中间缺的日期背景是这样:我想按下雨工作日和周末,不下雨工作日和周末,统计按15min集计订单时变量,然后绘制这种图于是筛选好四部分数据后,依次放入下面代码所示函数中进行集计resample_data=order_data.resample('15T',on='start_time').agg...
2020-04-22 16:46:26 2901
原创 字符串时间与datetime对象相互转换
普通的字符串与datetime对象时间互相转换普通字符串==>>datetime对象strptime 格式要对应parser.parse 格式自由datetime对象==>>普通字符串strftimefrom dateutil import parserimport datetimetime_string='Thu Dec 22 12:40:...
2020-04-19 23:03:02 1447
原创 pandas之上下行运算
有时候我们需要判断相邻两行关系,比如想去除掉相邻两行某个字段相同的数据行。比如我们可以写一个循环,判断每一行与上一行的关系但是pandas已经有了现成的函数供我们使用diff函数pandas.Series.diffCalculates the difference of a Series element compared with another element in the Ser...
2020-04-17 22:56:56 6903
原创 利用C4.5算法对鸢尾花分类
文章目录数据选取和数据情况利用C4.5算法分类离散化连续变量C4.5原理C4.5实现应用训练好的决策树分类数据选取和数据情况本次实验选取鸢尾花数据集(http://archive.ics.uci.edu/ml/datasets/Iris)数据包含5列,分别是花萼长度、花萼宽度、花瓣长度、花瓣宽度、鸢尾花种类。鸢尾花属种类包含三种:iris-setosa, iris-versicolour,...
2020-04-17 20:54:06 5491 14
原创 pandas之多行按类合并为一行
前言前面讲到explode操作是把某一列中的嵌套列表拆分为多行那有时候我们会有着相反的需求,即按照某一列,把相同值对应的多行合并成一行原理主要用到groupby函数+apply函数读取数据data=pd.read_csv('data.csv',header=None)data.columns=['car_id','time','lon','lat']2. 多列合并为一列...
2020-04-05 20:43:28 16772 4
原创 快速上手python操作postgresql
前言总结下前期利用python操作postgresql数据库的笔记,方便以后使用,顺便安利markdown真舒服python上传dataframe数据入数据库主要是通过create_engine来连接数据库进行数据上传pd.to_sql上传数据是dataframe形式则不需要新建表,直接上传即可,但是数据量很大的时候就很慢用到的主要函数是df.to_sql()函数,跟df.to...
2020-04-05 17:23:58 587
原创 如何绘制频率直方图+累计概率曲线
前言matplotlib画直方图是通过hist函数来画的,但是有时候或许我们想画一个直方图加上累计概率曲线,既然没有现成的,就只能咱们自己造了计算累计曲线ax1 = fig.add_subplot(111)a1,a2,a3=ax1.hist(data,bins =10, alpha = 0.65,normed=1,edgecolor='k')a1返回的是直方图每个柱子的高度,如果...
2020-04-04 23:12:10 13090
Python代码+GMM聚类算法+决策树(C4.5)分类算法
2023-07-20
mobike_beijing_geohash.rar
2020-06-16
TensorFlow 安装whl文件
2018-04-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人