最近身体不太舒服,停更几天,万分抱歉,望tie子们见谅。另外,在单位开始着手处理to C业务,需要处理size较大的数据,最近忙于学习、运用pandas和sql,近期总结、梳理一些常用的知识点。
本节知识点:pd.DataFrame中列的添加新column(s)常用两种途径
- 直接 赋值操作
- 通过assign method
添加新column(s) — 直接赋值
比较加单,直接上code
import pandas as pd
import numpy as np
df = pd.DataFrame({
'temp_c': [17.0, 25.0]} ,
index=('Portland', 'Berkeley') )
df
temp_c
Portland 17.0
Berkeley 25.0
df['temp_f']= df.temp_c * 9 / 5 + 32
# 等价于 df['temp_f']= df['temp_c'] * 9 / 5 + 32
df
temp_c temp_f
Portland 17.0 62.6
Berkeley 25.0 77.0
直接赋值的方法,类似于dict class的 key-value 赋值一般
- 如果没有这个column,则产生新的column;
- 如果column存在,更新该column中的value值
添加新column(s) — assign method
assign method是 pd.DataFrame class 的一个内置方法,用于添加或者更新 pd.DataFrame 的column(s)
这个才是今天的重点知识点
assign的code定义
class DataFrame(NDFrame):
def assign(self, **kwargs) -> "DataFrame":
r"""
Assign new columns to a DataFrame.
Returns a new object with all original columns in addition to new ones.
Existing columns that are re-assigned will be overwritten.
Parameters
----------
**kwargs : dict of {str: callable or Series}