今天主要学习了运用pandas查看数据以及数据索引的部分。
现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
Nowcoder_ID:用户ID
Level:等级
Achievement_value:成就值
Num_of_exercise:刷题量
Graduate_year:毕业年份
Language:常用语言
你可以使用pandas打开文件,偷偷看一下里面的内容,请输出你看到的前6行数据。
输入描述:
数据集直接从当前目录下的Nowcoder.csv文件中读取。
1.查看数据
输出该数据集的前6行
import pandas as pd
Nowcoder = pd.read_csv('Nowcoder.csv',sep=',',dtype=object)
print(Nowcoder.head(6))
输出该数据集的行数与列数
import pandas as pd
Nowcoder = pd.read_csv("Nowcoder.csv",sep=',',dtype=object)
print(Nowcoder.shape)
输出该数据集第10行的全部信息,每列信息单独成行
import pandas as pd
Nowcoder = pd.read_csv("Nowcoder.csv",sep=',',dtype=object)
print(Nowcoder.loc[10])
输出该数据集第10行到第20行的常用语言,每行数据单独成行
import pandas as pd
Nowcoder = pd.read_csv("Nowcoder.csv",sep=',',dtype=object)
print(Nowcoder.loc[10:20,'Language'])
2.数据索引
输出该数据集每列信息是否有为空值
import pandas as pd
Nowcoder = pd.read_csv("Nowcoder.csv",sep=',',dtype=object)
print(Nowcoder.isna().any())
输出该数据集中语言为Python对应的所有列的信息,包括列号
import pandas as pd
Nowcoder = pd.read_csv("Nowcoder.csv",sep=',',dtype=object)
print(Nowcoder.query('Language=="Python"'))
输出该数据集中语言为Python对应的成就值这一列的信息,包括列号
import pandas as pd
Nowcoder = pd.read_csv("Nowcoder.csv",sep=',',dtype=object)
print(Nowcoder[Nowcoder['Language']=='Python']['Achievement_value'])
该文件最后5行用户的用户ID、等级、成就值、常用语言等数据,包括行号
import pandas as pd
Nowcoder = pd.read_csv("Nowcoder.csv",sep=',')
a = Nowcoder.tail()
print(a[['Nowcoder_ID', 'Level', 'Achievement_value', 'Language']])