![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
小刘鸭!
这个作者很懒,什么都没留下…
展开
-
Decimal模块对dataframe列进行四舍五入
Decimal('0')保留整数,不要小数(0.0一位小数;0.00两位小数);先进行Decimal实例化,然后通过quantize方法四舍五入保留整数位。(2)假设对dataframe的average_age列应用。apply方法可以对该列的每个值都进行四舍五入操作。ROUND_HALF_UP四舍五入,对.5也进一。原创 2024-01-16 17:13:47 · 579 阅读 · 1 评论 -
pandas中reset_index()函数的参数及使用
默认为False。如果为True,则修改原始DataFrame,而不是返回一个新的DataFrame。:用于指定新的索引列的名称。如果提供了多个级别的新名称,可以传递一个元组,每个级别对应一个名称。如果为True,则删除索引列,而不是将其作为数据列添加到DataFrame中。:要重置的层级(可以是索引的名称、索引的位置或索引的列表)。默认情况下,将重置所有层级的索引。默认drop=False,将Name重新还原为了普通列。:指定要用作列级别的级别的名称或级别编号。:如果指定,用于替换丢失的列级别的值。原创 2023-12-13 13:33:53 · 931 阅读 · 0 评论 -
pd.DataFrame格式更改列的数据类型(astype方法)
3. 而students['grade']返回的是Series格式,因此用 students['grade'] = students['grade'].astype(int) 来更改时可能会出错,这里首先应该将列转换为浮点数,然后再将其转换为整数。2. students[['grade']] = students[['grade']].astype(int),students[['grade']]是包含grade列的Dataframe格式。1. 转换数据类型用astype方法,可以通过两种索引方式。原创 2023-11-30 10:12:29 · 758 阅读 · 0 评论 -
pandas 过滤数据 ,布尔型数组索引Series, DataFrame
过滤Series中或DataFrame列中数据,在pandas中,可以用isin(values)函数。原创 2023-12-02 19:46:07 · 61 阅读 · 1 评论 -
pandas 筛选 DataFrame数据的两种方式
注意对列的筛选有一个易错点,需要嵌套一层中括号, 不能写作['name', 'population', 'area']其中第一个括号是对行的筛选,第二个括号是对列的筛选(world['area']也可写作world.area)pandas筛选dataframe主要有 df[][] 和 df.loc[ , ]两种方式。二、df.loc[ , ] (注意这里也是中括号!(1) 对单条件的筛选,如果只要求筛选面积。逗号前是对行的筛选,逗号后是对列的筛选。(1) 对单条件的筛选。(2)对多条件的筛选。原创 2023-12-01 18:53:41 · 738 阅读 · 1 评论 -
DataFrame 去除重复行(移除重复数据)drop_duplicates()方法
其中subset是根据哪些列来查找重复项,inplace表明是否原地修改(false即不原地修改,而是返回一个dataframe)dataframe中去除重复行数据使用drop_duplicates方法。在筛选玩浏览了自己博客的作者后,需要进行去重,具体如下。例题:leetcode 1148题。原创 2023-12-04 21:30:07 · 1069 阅读 · 0 评论 -
pd.DataFrame索引列的两种索引方式的区别,students[‘grade‘]和students[[‘grade‘]]的区别
3. students[['grade']]是个只包含一列的Dataframe,但可以在处理多列时保持一致性,因为无论选择一列还是多列,结果始终是一个 DataFrame。2. students[['grade']]返回的是包含grade列的pd.Dataframe格式。1. students['grade']返回的是pd.Series格式。原创 2023-11-30 09:53:03 · 201 阅读 · 0 评论 -
reset_index()函数,以及在groupby后使用reset_index()函数的作用
当你对数据框进行一些操作,如set_index、groupby等,之后,会导致数据框索引发生变化(比如原来是整数索引,现在变为了层次化索引),reset_index()可以帮你重新设置索引,将之前的索引还原成数据框中的普通列,并生成一个新的整数索引。打印结果如下所示,将普通列Name设置为了索引列, 通过reset_index将其还原为了普通列,并重新添加了整数索引列。打印结果如下所示:groupby会导致分组变量Name自动成为索引列,通过reset_index将其还原。原创 2023-12-12 13:47:42 · 2833 阅读 · 0 评论 -
dataframe 中列中字符串的首字母大写 字符串首字母大写(title()和 capitalize()函数区别)
【代码】dataframe 中列中字符串的首字母大写 字符串首字母大写(title()和 capitalize()函数区别)原创 2023-12-05 19:56:51 · 80 阅读 · 1 评论