python数据框dataframe功能总结(转载)

1.数据框增加一列,df['new'] = test[0]表示给df新增一列,列名为new,整列值为test[0];

 
  1. import pandas as pd

  2.  
  3. a = {'ip':[1,2,3,4],'name':[0,9,8,77],'time':['qq','ww','ee','rr']}

  4. df = pd.DataFrame(a)

  5. test = ['qqq','eeee']

  6. df['new'] = test[0]

  7. print(df)

2.数据框列内容筛选,

df1 = df[df['name'].isin([9,8])]表示筛选name列为9和8的数据框;

df2 = df[~df['name'].isin([9,8])]表示筛选name列不是9和8的数据框,~表示反;

df3 = df[(df['name'] > 9) | (df['name'] < 8)]表示筛选name列大于9或小于8的数据框,|表示或;
df4 = df[(df['ip'] > 2) & (df['ip'] <= 4)]表示筛选ip列大于2且小于等于4的数据框,&表示且。

 
  1. import pandas as pd

  2.  
  3. a = {'ip':[1,2,3,4],'name':[0,9,8,77],'time':['qq','ww','ee','rr']}

  4. df = pd.DataFrame(a)

  5. df1 = df[df['name'].isin([9,8])]

  6. df2 = df[~df['name'].isin([9,8])]

  7. df3 = df[(df['name'] > 9) | (df['name'] < 8)]

  8. df4 = df[(df['ip'] > 2) & (df['ip'] <= 4)]

  9. print(df1)

  10. print(df2)

  11. print(df3)

  12. print(df4)

3.数据框,获取行数、列数及第几行第几列的值

 
  1. import pandas as pd

  2.  
  3. a = {'ip':[1,2,3,4],'name':[0,9,8,77],'time':['qq','ww','ee','rr']}

  4. df = pd.DataFrame(a)

  5. print(df)

  6. colum_size = df.columns.size#列数 2

  7. row_size = df.iloc[:,0].size#行数 3

  8. num1 = df.iloc[[0]].values[0][0]#第一行第一列的值 1

  9. num2 = df.iloc[[1]].values[0][1]#第二行第二列的值 9

  10. print(colum_size)

  11. print(row_size)

  12. print(num1)

  13. print(num2)

4.数据框固定列顺序

 
  1. import pandas as pd

  2.  
  3. a = {'ip':[1,2,3,4],'name':[0,8,8,77],'time':['qq','ww','ee','rr']}

  4. df = pd.DataFrame(a)

  5. b = ['name','ip','time']

  6. df1 = df.loc[:,b]

  7. print(df1)

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python可以使用Pandas库来处理CSV文件和DataFrame数据。下面是一些常用的操作: 1.读取CSV文件 可以使用Pandas库的read_csv函数来读取CSV文件,并将其转换为DataFrame数据格式。 ```python import pandas as pd df = pd.read_csv('data.csv') ``` 2.查看DataFrame数据 可以使用Pandas库的head和tail函数来查看DataFrame数据的前几行和后几行。 ```python df.head() # 查看前5行 df.tail() # 查看后5行 ``` 3.选择数据 可以使用Pandas库的loc和iloc函数来选择DataFrame数据的行和列。 ```python # 选择第1行和第2列 df.iloc[0, 1] # 选择第1行到第3行,第2列到第4列的数据 df.iloc[0:3, 1:4] # 选择名称为'column1'的列 df.loc[:, 'column1'] # 选择名称为'column1'和'column2'的列 df.loc[:, ['column1', 'column2']] ``` 4.过滤数据 可以使用Pandas库的条件语句和逻辑运算符来过滤DataFrame数据。 ```python # 选择column1大于10的行 df[df['column1'] > 10] # 选择column1大于10且column2小于20的行 df[(df['column1'] > 10) & (df['column2'] < 20)] # 选择column1等于10或column2等于20的行 df[(df['column1'] == 10) | (df['column2'] == 20)] ``` 5.处理缺失值 可以使用Pandas库的fillna函数来处理缺失值。 ```python # 将所有缺失值用0填充 df.fillna(0) # 将缺失值用前一个非缺失值填充 df.fillna(method='ffill') # 将缺失值用后一个非缺失值填充 df.fillna(method='bfill') ``` 6.保存DataFrame数据 可以使用Pandas库的to_csv函数将DataFrame数据保存为CSV文件。 ```python df.to_csv('new_data.csv', index=False) ``` 除了以上常用操作,Pandas库还提供了许多其他函数和方法,可以根据具体需求进行使用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值