【Python篇】

这篇博客展示了如何使用Python的pandas库来查看和分析牛客网用户数据集。首先通过`pd.read_csv()`加载数据,并指定dtype为object以避免日期字段被错误解析。接着,通过`.head()`, `.loc[]`和`.iloc[]`方法展示数据的前几行。博主还展示了数据集的形状、大小和获取特定行的方法,并统计了部分用户的语言使用情况。这为后续的数据分析打下了基础。
摘要由CSDN通过智能技术生成

python数据分析

01 查看数据

import pandas as pd
# 打开文件时需要添加dtype=object,防止年份信息读取为小数
Nowcoder = pd.read_csv('Nowcoder.csv',sep=',',dtype=object)
# DA1 用pandas查看牛客网用户数据
print(Nowcoder.head(6))
print(Nowcoder[0:6])
print(Nowcoder.iloc[:6,:])
# DA2 牛客网用户数据集的大小
print(Nowcoder.shape) #(52, 6)
print(Nowcoder.size) #312
print(len(Nowcoder)) #52
# DA3 牛客网的第10位用户
print(Nowcoder.loc[10])
print(Nowcoder.iloc[10])
#loc :  Selection by Label ,按标签取数据, 
#loc[行索引,列名/column]
#(如果第二个参数的个数是全部即 : ,可以省略不写)。
#例:print(df.loc[1,'name'])    # 索引1(行),名为‘name’的列
#iloc :  Selection by Position,即按位置选择只接受整型参数。
#不接受列字段名称作为参数,只支持列字段的位置索引作为参数。
#iloc[行索引,列索引](没有逗号及以后就是默认列为所有列)
#例:print(df.iloc[1,0])   # 第2行第1列的值
# DA4 统计牛客网部分用户使用语言
print(Nowcoder.loc[10:20, 'Language'])
print(Nowcoder.iloc[10:20, 5])
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值