![](https://img-blog.csdnimg.cn/20210918151007680.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
pandas
pandas常用知识点整理
J_caicaicai
这个作者很懒,什么都没留下…
展开
-
【numpy】np.digitize(arr, bins) 用法
numpy.digitize()的使用方法及分bin解释原创 2022-11-25 15:44:29 · 463 阅读 · 0 评论 -
【pandas】调整Dataframe中列的顺序(放到任意位置)
dataframe调整列的顺序原创 2022-09-24 15:47:49 · 2043 阅读 · 0 评论 -
【pandas】在Pandas中降低dataframe使用的内存
pandas中降低dataframe占用内存的两种方法原创 2022-07-22 16:20:08 · 1436 阅读 · 0 评论 -
【pandas】Pandas中Datetime与Date的转化
pandas中日期时间datetime转换成date仅日期原创 2021-12-18 14:45:31 · 5779 阅读 · 3 评论 -
【panda01】预备知识
Python 基础1. 列表推导式与条件赋值L = []def my_func(x): return 2*xfor i in range(5): L.append(my_func(i))L[0, 2, 4, 6, 8]列表表达式 [映射函数 for i in 迭代的对象][my_func(i) for i in range(5)][0, 2, 4, 6, 8][m+'_'+n for m in ['a', 'b'] for n in ['c', 'd']]原创 2020-12-16 20:36:34 · 202 阅读 · 0 评论 -
【pandas02】pandas基础
pandas基础pandas 版本需在’1.1.5’以上文件的读取和写入基本数据结构常用基本函数在 clip 中,超过边界的只能截断为边界值,如果要把超出边界的替换为自定义的值,应当如何做?可以用where吧窗口对象练习...原创 2020-12-19 18:12:18 · 220 阅读 · 0 评论 -
【pandas03】索引器
索引器表的列索引序列的行索引loc索引器练一练,实现 select_dtypes('number')select_dtypes 是一个实用函数,它能够从表中选出相应类型的列,若要选出所有数值型的列,只需使用 .select_dtypes('number') ,请利用布尔列表选择的方法结合 DataFrame 的 dtypes 属性在 learn_pandas 数据集上实现这个功能。df_demo.loc[:,[str(df_demo[v].dtype) in {'float64', '原创 2020-12-21 23:40:38 · 646 阅读 · 2 评论 -
【pandas04】分组
感谢datawhale开展的每月组队学习,教材ref:第四章:分组分组模式及其对象分组的一般模式分组依据的本质???? 练一练请根据上下四分位数分割,将体重分为high、normal、low三组,统计身高的均值。计算三分位的边界在哪里weight_tertile = list(df.Weight.quantile([.33, .66]))确定分组依据我们可以写一个function去把Weight转换成 low,normal和high,根据我们上面得到的分位数边界普通funct原创 2020-12-24 21:15:15 · 2449 阅读 · 9 评论 -
【pandas05】变形
感谢datawhale开展的每月组队学习,教材ref: 第五章:变形长宽表的变形df.pivot()datawhale这几个图解画的太优秀了!!爱了爱了单列pivot操作多列pivot操作df.pivot_table()df.melt()pd.wide_to_long()原创 2020-12-27 22:23:01 · 155 阅读 · 0 评论 -
【pandas06】连接
感谢datawhale开展的每月组队学习,教材ref: 第六章:连接关系型连接方向连接类连接操作练习Ex1:美国疫情数据集现有美国4月12日至11月16日的疫情报表,请将 New York 的 Confirmed, Deaths, Recovered, Active 合并为一张表,索引为按如下方法生成的日期字符串序列:In [61]: date = pd.date_range('20200412', '20201116').to_series()In [62]: date =原创 2020-12-29 11:27:36 · 181 阅读 · 1 评论 -
【pandas07】缺失数据
缺失数据缺失值的统计缺失值的删除缺失值的填充缺失值的插值Nullable类型练习Ex1:缺失值与类别的相关性检验在数据处理中,含有过多缺失值的列往往会被删除,除非缺失情况与标签强相关。下面有一份关于二分类问题的数据集,其中 X_1, X_2 为特征变量, y 为二分类标签。In [97]: df = pd.read_csv('data/missing_chi.csv')In [98]: df.head()Out[98]: X_1 X_2 y0 NaN原创 2021-01-03 22:16:40 · 131 阅读 · 2 评论 -
【pandas08】文本数据
文本数据感谢datawhale开展的每月组队学习,本章教材ref: 第八章 文本数据str对象正则表达式基础一般字符的匹配元字符基础简写字符集文本处理的五类操作拆分合并匹配替换提取常用字符串函数字母型函数数值型函数统计型函数格式型函数练习Ex1:房屋信息数据集现有一份房屋信息数据集如下:In [114]: df = pd.read_excel('data/house_info.xls', usecols=[ .....:原创 2021-01-06 23:13:13 · 183 阅读 · 0 评论 -
【pandas09】分类数据
分类数据感谢datawhale开展的每月组队学习,本章教材ref:第九章 分类数据cat对象有序分类区间类别练习Ex1:统计未出现的类别Ex2:钻石数据集原创 2021-01-07 23:37:26 · 61 阅读 · 0 评论 -
【pandas10】时序数据
分类数据感谢datawhale开展的每月组队学习,本章教材ref:第十章:时序数据时序数据时序中的基本对象时间戳Timestamp的构造与属性Datetime序列的生成dt对象时间戳的切片与索引时间差日期偏置时序中的滑窗与分组...原创 2021-01-10 20:34:15 · 117 阅读 · 0 评论 -
【pandas11】综合练习
显卡日志下面给出了3090显卡的性能测评日志结果,每一条日志有如下结构:Benchmarking #2# #4# precision type #1##1# model average #2# time : #3# ms其中#1#代表的是模型名称,#2#的值为train(ing)或inference,表示训练状态或推断状态,#3#表示耗时,#4#表示精度,其中包含了float, half, double三种类型,下面是一个具体的例子:Benchmarking Inference原创 2021-01-13 22:52:24 · 80 阅读 · 0 评论 -
【pandas】对时间列的操作
把一列 数据类型为 object的列转换为 datetime类型的列用 pd.to_datetime(series_a)df_state.Begin_Time = pd.to_datetime(df_state.Begin_Time)df_state.End_Time = pd.to_datetime(df_state.End_Time)计算这两个时间点的间隔:df_state.End_Time - df_state.Begin_Time #用减号就行这个时间间隔的输出会是以天为单位的,想原创 2021-09-18 15:08:36 · 239 阅读 · 0 评论