数据分析之-pandas

本文介绍了pandas库的安装方法,适用于Windows和Linux系统。接着,重点讲解了pandas的常用数据结构,包括读取文件、数据过滤、去重、空数据检查以及处理数据中的空格等基本操作。
摘要由CSDN通过智能技术生成

1.pandas库安装导入

windows下和linux下都可以使用pip安装,安装之前最好把pip升级到最新版

python -m pip  install --upgrade pip	#升级pip 
pip install pandas	#安装pandas
import pandas as pd	#导入并别名为pd

2.常用方法介绍

  • 1.pandas 3种常用数据结构演示
函数 说明
pd.Series() 一维数据结构
pd.DataFrame() 二维数据结构(可以理解为表格结构)
pd.Panel() 三维数据结构
dict={
   '数学':90,'语文':80,'英语':100}
dicts1=pd.Series([1,2,3,4,5])
dicts2=pd.DataFrame(dict,index=['小明','小刘','小王'])

dicts1
#输出
0    1
1    2
2    3
3    4
4    5
dtype: int64

dicts2
#输出
    数学 语文 英语
------------------
小明 90	 80  100
小刘 90	 80  100
小王 90	 80  100

  • 2.pandas读文件
函数 说明
pd.read_csv(‘date.csv’) 读取.csv的文件
pd.read_excel(‘date.xlsx’) 读取.xlsx文件,需要单独安装此模块
date.columns 输出所有的列,也就是第一行
date.index 输出表的总行数
date.reindex([a,b,c,d,e],method=‘bfill’) reindex修改列值(索引列表),method设置前填充(ffill)或者后填充(bfill)
date.values 打印所有行列对应的数据
date.head(2) 打印数据的头2行
date·.tail(2) 打印数据的后2行
date.loc[] 行和列的引用
date.iloc[] 行和列的引用
date.T 翻转行和列
date.sort_index(axis=0/1,ascending = True/False) 1是横向排序,0是纵向排序,True是升序,False是降序
date.sort_values(by =" ",ascending = True/False) 以行里某个列排序可以按照多列排序,True是升序,False是降序
data=pd.read_csv('data.csv')
data
#输出
    id         key       value
-------
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值