pandas
还是那个同伟伟
百万代码中取bug首级
展开
-
Pandas中两个DataFrame求差集
【代码】Pandas中两个DataFrame求差集。原创 2024-03-21 10:23:12 · 797 阅读 · 0 评论 -
pandas将时间列,分组聚合成间隔两个小时或者随意时间的间隔,统计个数
Pandas中的resample,重新采样,是对原样本重新处理的一个方法,是一个对常规时间序列数据重新采样和频率转换的便捷的方法。重新取样时间序列数据。方便的时间序列的频率转换和重采样方法。对象必须具有类似datetime的索引(DatetimeIndex、PeriodIndex或TimedeltaIndex),或将类似datetime的值传递给on或level关键字。有关resample()的用法可参考:Pandas中resample方法详解_风雪云侠的博原创 2022-09-21 15:43:29 · 1016 阅读 · 0 评论 -
Pandas打印所有行和列(显示所有的行和列)
Pandas打印所有行和列,显示所有的行和列# 显示所有列pd.set_option('display.max_columns', None)# # 显示所有行pd.set_option('display.max_rows', None)原创 2022-03-17 08:33:18 · 8777 阅读 · 0 评论 -
Pandas的学习(pandas中删除行以及重排(重建)行索引)
1.通过行号删除df.drop(df.index[0], inplace=True) # 删除第一行df.drop(df.index[0:3], inplace=True) # 删除前三行df.drop(df.index[0, 2, 5], inplace=True) # 删除第1行,第3行,第6行# 中括号方式的取值,都是左闭右开......原创 2021-09-11 17:04:17 · 12531 阅读 · 0 评论 -
Pandas的学习(读取mongodb数据库集合到DataFrame,将DataFrame类型数据保存到mongodb数据库中)
1.读取mongodb数据库集合到DataFrameimport pymongoimport pandas as pdclient = pymongo.MongoClient("数据库连接字符串") # 第二种方式 host='localhost', port=27017db = client['要读取的数据库名']coll_name = db['要读取的集合名']# 读取mongodb的集合到pandasdf = pd.DataFrame(list(coll_name.fin..原创 2021-09-02 10:48:04 · 2770 阅读 · 0 评论 -
Pandas的学习(6.DataFrame和Series创建多层行索引以及多层列索引)
1.创建多层行索引(1) 隐式构造 最常见的方法是给DataFrame构造函数的index参数传递两个或更多的数组 -- Series也可以创建多层索引import numpy as npimport matplotlib.pyplot as pltimport pandas as pdfrom pandas import Series, DataF...原创 2019-05-29 18:34:58 · 3122 阅读 · 0 评论 -
Pandas的学习(5.pandas中处理丢失数据和空值数据以及填充空值数据)
处理丢失数据 有两种丢失的数据: -- None -- np.nan(NaN)1.None None是Python自带的,其类型为python object。因此,None不能参与到任何计算中 object类型的运算要比int类型的运算慢得多2.np.nan(NaN) np.nan...原创 2019-05-29 08:34:01 · 3121 阅读 · 0 评论 -
Pandas的学习(3.DataFrame的创建方法和三种索引方法(iloc、loc、values)以及切片)
DataFrame DataFrame是一个【表格型】的数据结构,可以看做是【由Series组成的字典】(共用同一个索引)。DataFrame由按一定顺序排列的多列数据组成,设计初衷是将Series的使用场景从一维拓展到多维。DataFrame既有行索引,也有列索引、 --- 行索引: index--- 列索引: columns--- 值: values(numpy的...原创 2019-05-24 11:31:56 · 7802 阅读 · 0 评论 -
Pandas的学习(4.DataFrame之间的运算以及DataFrame和Series之间的运算)
DataFrame的运算 1.DataFrame之间的运算 同Series一样: --- 在运算中自动对齐不同索引的数据 --- 如果索引不对应,则补NaN 无论是行不对应还是列不对应,都会补充NaN值from pandas import DataFrameimport numpy as ...原创 2019-05-27 09:48:40 · 6763 阅读 · 0 评论 -
Pandas的学习(2.Series的索引和切片、基本概念以及Series的运算)
Series的索引和切片 可以取中括号取单个索引(此时返回的是元素类型),或者中括号里一个列表取多个索引(此时返回的仍然是一个Series类型) 分为显示索引和隐式索引:(1) 显示索引 (必须给索引的值): -- 使用index中的元素作为索引值 -- 使用 .loc[] (推荐)注意此时是闭区间import numpy as npfrom...原创 2019-05-23 11:03:38 · 2296 阅读 · 0 评论 -
Pandas的学习(1.pandas的介绍以及pandas中的Series的创建)
什么是Pandas?1. Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的2.pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具3.pandas提供了大量能使我们快速便捷地处理数据的函数和方法4.它使Python成为强大而高效的数据分析环境的重要因素之...原创 2019-05-20 17:04:35 · 227 阅读 · 0 评论