Python-数据分析类语法

这篇博客详细介绍了Python的pandas库在数据分析中的基本操作,包括读取csv文件,获取行数和列数,查找和处理空值,多条件查找,设置显示限制,使用统计函数,转换数据格式,处理异常数据,以及使用groupby和计算平均次日留存率等关键功能。
摘要由CSDN通过智能技术生成

一、pandas简单操作

1、读取文件

1.1、读取csv,输出文件行数和列数

import sys
#导入pandas类
import pandas as pd
#打开文件
Nowcoder=pd.read_csv('Nowcoder.csv',encoding='ISO-8859-1',sep=',',dtype=object)
#获取钱6行数据/head(n)函数/后几行tail(n)函数
print(Nowcoder.head(6))
#获取行数和列数
##第一种
print(nowcoder.shape)
##第二种
a = len(Nowcoder)
b = len(Nowcoder.columns)
print((a,b))

1.2、获取指定行数据和列数据

import sys
import pandas as pd
Nowcoder=pd.read_csv('Nowcoder.csv',encoding='ISO-8859-1',sep=',',dtype=object)
#loc[行索引,列名],:则为全部列数据
print(Nowcoder.loc[10,:])
print(Nowcoder.loc[10:20,'Language'])#获取第10-20行列名为language的数据
#iloc[行索引,列索引],没有则为全部数据
print(Nowcoder.iloc[10,:])
#获取某个指定列值的所有信息(例:语言为Python的所有数据)
print(Nowcoder[Nowcoder['Language']=='Python'])
#print(Nowcoder.loc[Nowcoder['Language']=='Python'])
#nowcoder[行][列]按照此格式获取数据
print(nowcoder[nowcoder['Language']=='Python']['Achievement_value'])
#输出最后5行的部分字段数据
print(Nowcoder[['Nowcoder_ID','Level','Achievement_value','Language']].tail(5))

1.3、判断一行或一列中是否有空值

print(Nowcoder.isnull().any(axis=0))
# isnull: 判断是否为空。
#        返回bool类型的值&
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值