现有一个Nowcoder.csv文件,它记录了牛客网的部分用户数据,包含如下字段(字段与字段之间以逗号间隔):
Nowcoder_ID:用户ID
Level:等级
Achievement_value:成就值
Num_of_exercise:刷题量
Graduate_year:毕业年份
Language:常用语言
你不需要输出全部数据,请直接告诉我们这个数据集的大小,即行数与列数。
输入描述:
数据集直接从当前目录下的Nowcoder.csv文件中读取。
输出描述:
输出该数据集的行数与列数,如下所示:
本题涉及pandas基础应用。我们通过read_csv()读取csv文件,读取后是一个DataFrame类型的数据。该类型由行和列组成,其中第一列数据是索引列,用于索引对应的行,索引可以自己设置,默认是从0开始的数字序列。其他列可以是不同数据类型的series。
由于df的数据结构是类似[[],[],...]的,相当于二维列表,内嵌的[]表示一行数据,因此这里可以用len(df)来获取DataFrame数据的行数。而要获取列数,这里可以通过loc属性返回指定的数据行,如loc[0]表示获取df的第一行数据,而第一行数据的长度就表示列数,因此可以用len(df.loc[0])获取df的列数。最后将两个数放到一个元组中,从而获得最终的答案。
import pandas as pd
df=pd.read_csv('Nowcoder.csv')
print((len(df),len(df.loc[0])))