python.pandas 进阶
文章平均质量分 78
诸葛老刘
生命短暂,我用python
展开
-
pandas 向量化字符串操作
文章目录1.简介2. 示例代码2.1 小试一刀2.2 pandas 字符串方法列表2.3 pandas 字符串向量化操作支持正则表达式2.4 其它字符串方法1.简介使用numpy与pandas 对数组元素进行操作,向量化操作简化了纯数值的数组操作语法–无需关注数据长度或维度,只关心需要的操作2. 示例代码2.1 小试一刀Administrator@cibpc-019 MINGW64 /$ ipythonPython 3.6.7 (default, Jul 2 2019, 02:21:41原创 2020-05-12 17:14:16 · 751 阅读 · 0 评论 -
pandas.DataFrame迭代
文章目录1. df.iteritems()2. df.iterrows()3. df.itertuples()4. 直接迭代1. df.iteritems()Administrator@cibpc-019 MINGW64 /$ ipythonPython 3.6.7 (default, Jul 2 2019, 02:21:41) [MSC v.1900 64 bit (AMD64)]T...原创 2020-03-23 11:48:02 · 1302 阅读 · 0 评论 -
python pandas.DataFrame.groupby()方法详解
文章目录DataFrame.groupby()概览应用举例以下内容参考自官方文档详情应用参考文档DataFrame.groupby()概览DataFrame.groupby(self, by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=Fals...原创 2019-10-21 14:52:30 · 7569 阅读 · 0 评论 -
pandas.DataFrame缺省值\空值处理\空值计算
文章目录1 删除空值[dropna()]2 填充空值[fillna()]1 删除空值[dropna()]DataFrame.dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)函数作用:删除含有空值的行或列axis:维度,axis=0表示index行,axis=1表示columns列,默认为0ho...原创 2019-10-16 17:48:51 · 3224 阅读 · 0 评论 -
pandas.DataFrame.to_dict()的使用详解
将df转为字典时的用法以下基于windows10, python3.6环境通过验证In [1]: import pandas as pdIn [2]: import numpy as npIn [3]: df = pd.DataFrame({'colA' : list('AABCA'), 'colB' : ['X',np.nan,'Ya','Xb','Xa'],'colC' : [...原创 2019-02-18 16:23:27 · 54270 阅读 · 4 评论 -
pandas.DataFrame去重
pandas.DataFrame 去重去重的方式:样本数据In [1]: import pandas as pdIn [2]: df = pd.DataFrame({'colA' : list('AABCA'), 'colB' : list('AABDA'),'col ...: C' : [100,100,30,50,20], 'colD': [100,100,60,80,50]...原创 2018-09-26 12:59:31 · 31128 阅读 · 0 评论 -
从pandas文档 学到的read_excel, to_excel, json, Normalization,to_sql(节选)
从同一个excel文件中读取指定的sheet表# 方法1: (推荐)with pd.ExcelFile('path_to_file.xls') as xls: df1 = pd.read_excel(xls, 'Sheet1') df2 = pd.read_excel(xls, 'Sheet2')# 方法2: (推荐)data = {} # For when Shee...原创 2019-02-20 16:21:49 · 554 阅读 · 0 评论 -
pandas.DataFrame.apply() 具体应用 实现新增 统计行 或 统计列
最近在工作中需要用到对pandas的列数据进行sum()统计,那就需要新增一行数据实现方法如下:import pandas as pdimport numpy as npdf = pd.DataFrame([ {'date': '2018-12-01', 'total': 100, 'total2': 100.23}, {'date': '2018-12-02', 'tot...原创 2018-12-06 19:31:37 · 4809 阅读 · 0 评论 -
pandas map(), apply(), applymap() 区别解析
基础以下操作基于python 3.6 windows 10 环境下 通过 将通过实例来演示三者的区别toward_dict = {1: '东', 2: '南', 3: '西', 4: '北'}df = pd.DataFrame({'house' : list('AABCEFG'), 'price' : [100, 90, '', 50, 120, 150, 200],'toward' ...原创 2018-08-07 20:01:52 · 43395 阅读 · 9 评论 -
DataFrame 数据实现分页功能
话不多说,直接上码:page = 1 #页码数offset = 10 #偏移量 默认情况下,offset = limitlimit = 10 #每页的数据量df = df[(int(page) - 1) * int(offset): (int(page) - 1) * int(offset) + int(limit)]offset 偏移量???? 什么鬼?举个例子 共有10...原创 2018-08-10 16:07:06 · 3961 阅读 · 0 评论 -
pandas与sql 对比,持续更新...
欢迎来到诸葛老刘的博客由于工作关系 , 经常会用到sql和python的pandas模块,两者有很多相似之处,我将整理出系列的对比文章,并保持更新. 若有不尽之处,敬请指出.基础说明本文代码环境基于windows 10 和 anaconda3创建的.python3.6虚拟环境 - 下表的名字,在sql中数据叫table, 在pandas中叫df, 在一般的df中id这个字符是不...原创 2018-08-03 17:29:13 · 10749 阅读 · 8 评论