1.创建一个数据帧以及增加新的数据
# 创建一个数据帧
import pandas as pd
dataframe = pd.DataFrame()
dataframe['name'] = ['小明', '小红']
dataframe['age'] = [12, 45]
dataframe['Driver'] = [True, False]
print(dataframe)
# 增加新的数据
new_person = pd.Series(['小芳', 15, True], index=['name', 'age', 'Driver'])
dataframe = pd.concat([dataframe, new_person.to_frame().T], ignore_index=True) # 使用concat函数将新数据添加到数据帧中
print(dataframe)
2.查看数据集
#查看数据集
import pandas as pd
#创建URL
url='data.csv'
#加载数据集
dataframe=pd.read_csv(url)
#查看数据集方式
print(dataframe.head(2)) #使用head查看前几行
print(dataframe.shape) #使用shape查看多少行多少列
print(dataframe.tail) #使用tail查看最后几行
print(dataframe.describe()) #使用describe能查看任何数值型列的基本统计量
3.从一个数据帧中挑出单个或一部分数据 (iloc)
import pandas as pd
url='data.csv'
dataframe=pd.read_csv(url)
print(dataframe.iloc[:4]) #选择前五行
4.根据条件语句选择数据帧的行数据
#根据条件语句选择数据帧的行数据
import pandas as pd
url='data.csv'
dataframe=pd.read_csv(url)
a=dataframe[dataframe['Column_2']==2] #选出了第二列全为2的行
print(a) #选择前五行
b=dataframe[(dataframe['Column_2']==2) & (dataframe['Column_3']==5)]
#选出了第二列为2,第三列为5的数
print(b)
5.根据条件语句选择数据帧的行数据
#根据条件语句选择数据帧的行数据
import pandas as pd
url='data.csv'
dataframe=pd.read_csv(url)
a=dataframe[dataframe['Column_2']==2] #选出了第二列全为2的行
print(a) #选择前五行
b=dataframe[(dataframe['Column_2']==2) & (dataframe['Column_3']==5)]
#选出了第二列为2,第三列为5的数
print(b)
6.替换数据帧的一些值 (replace)
#替换数据帧的一些值 (replace)
import pandas as pd
url='data.csv'
dataframe=pd.read_csv(url)
dataframe=dataframe['Column_2'].replace([2],[8]) #将第二列的2替换成8
print(dataframe.iloc[:4])
7. 重命pandas数据帧的列 (rename)
#重命pandas数据帧的列 (rename)
import pandas as pd
url='data.csv'
dataframe=pd.read_csv(url)
dataframe=dataframe.rename(columns={'Column_2': 'name'}) #将第二列的列名替换成name
print(dataframe.iloc[:4])