数据整理,数据清洗的相关操作

1.创建一个数据帧以及增加新的数据

# 创建一个数据帧
import pandas as pd
dataframe = pd.DataFrame()
dataframe['name'] = ['小明', '小红']
dataframe['age'] = [12, 45]
dataframe['Driver'] = [True, False]
print(dataframe)
# 增加新的数据
new_person = pd.Series(['小芳', 15, True], index=['name', 'age', 'Driver'])
dataframe = pd.concat([dataframe, new_person.to_frame().T], ignore_index=True)  # 使用concat函数将新数据添加到数据帧中
print(dataframe)

2.查看数据集

#查看数据集
import pandas as pd
#创建URL
url='data.csv'
#加载数据集
dataframe=pd.read_csv(url)
#查看数据集方式
print(dataframe.head(2))  #使用head查看前几行
print(dataframe.shape)   #使用shape查看多少行多少列
print(dataframe.tail)   #使用tail查看最后几行
print(dataframe.describe())  #使用describe能查看任何数值型列的基本统计量

 3.从一个数据帧中挑出单个或一部分数据 (iloc)

import pandas as pd
url='data.csv'
dataframe=pd.read_csv(url)
print(dataframe.iloc[:4])   #选择前五行

4.根据条件语句选择数据帧的行数据

#根据条件语句选择数据帧的行数据
import pandas as pd
url='data.csv'
dataframe=pd.read_csv(url)
a=dataframe[dataframe['Column_2']==2]   #选出了第二列全为2的行
print(a)   #选择前五行
b=dataframe[(dataframe['Column_2']==2) & (dataframe['Column_3']==5)]
#选出了第二列为2,第三列为5的数
print(b)

5.根据条件语句选择数据帧的行数据

#根据条件语句选择数据帧的行数据
import pandas as pd
url='data.csv'
dataframe=pd.read_csv(url)
a=dataframe[dataframe['Column_2']==2]   #选出了第二列全为2的行
print(a)   #选择前五行
b=dataframe[(dataframe['Column_2']==2) & (dataframe['Column_3']==5)]
#选出了第二列为2,第三列为5的数
print(b)

 6.替换数据帧的一些值 (replace)

#替换数据帧的一些值 (replace)
import pandas as pd
url='data.csv'
dataframe=pd.read_csv(url)
dataframe=dataframe['Column_2'].replace([2],[8])  #将第二列的2替换成8
print(dataframe.iloc[:4])

7. 重命pandas数据帧的列 (rename)

#重命pandas数据帧的列 (rename)
import pandas as pd
url='data.csv'
dataframe=pd.read_csv(url)
dataframe=dataframe.rename(columns={'Column_2': 'name'})  #将第二列的列名替换成name
print(dataframe.iloc[:4])
  • 6
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值