pandas的基本使用方法

这篇博客主要介绍了pandas模块的基础使用,包括数据读取、数据清洗和数据分析等核心功能。通过学习,读者可以掌握pandas在数据分析中的基本应用。
摘要由CSDN通过智能技术生成

本文用于学习pandas模块的基本使用方法!!!

from pandas import *
#import pandas as pd
import numpy as np


#读取csv、xlsx文件,获得DataFrame数据结构
#data = pd.read_csv('filename.csv',header=None)
#data = pd.read_excel('filename.xlsx')

#将DataFrame数据结构保存为csv文件
#data.to_csv('filename.csv',header=None,index=False)

'''
数据结构:Series
Series:由numpy数据类型和与之对应的索引组成
'''
#创建Series数据结构
obj = Series([3,2,1])
print(obj)

#获得Series数据结构对象的数据和索引
print(obj.values)
print(obj.index)

#获得唯一值组成的数组
print(obj.unique())

#获得各值出现的频率
print(obj.value_counts())

#判断缺失数据 True表示缺失
obj = Series([1,np.nan,2,np.nan,3,np.nan])

print(obj.isnull())
print(isnull(obj))
print(notnull(obj))
print(obj.notnull())

#删除缺失值
print(obj.dropna())
print(obj[obj.notnull()])

#对数据标记索引
obj = Series([1,2,3,4],index=['a','b','c','d'])
#通
Pandas是一个强大的数据处理和分析工具,它提供了丰富的功能和方法来处理和操作数据。以下是一些Pandas基本方法: 1. 创建DataFrame:可以使用Pandas的DataFrame对象来创建和操作数据表。可以通过传入字典、列表、数组等不同的数据结构来创建DataFrame。 2. 读取和写入数据:Pandas可以读取和写入各种格式的数据,如CSV、Excel、SQL数据库等。可以使用`read_csv()`、`read_excel()`等方法读取数据,使用`to_csv()`、`to_excel()`等方法写入数据。 3. 数据查看和统计:可以使用`head()`方法查看DataFrame的前几行数据,默认为前5行;使用`tail()`方法查看DataFrame的后几行数据,默认为后5行。还可以使用`describe()`方法获取DataFrame的统计信息,如均值、标准差、最小值、最大值等。 4. 数据选择和过滤:可以使用`loc[]`和`iloc[]`方法进行数据的选择和过滤。`loc[]`用于基于标签进行选择,`iloc[]`用于基于位置进行选择。可以通过传入行索引和列索引来选择特定的数据。 5. 数据排序:可以使用`sort_values()`方法对DataFrame进行排序。可以指定要排序的列名以及升序或降序排列。 6. 数据聚合和分组:可以使用`groupby()`方法对数据进行分组和聚合操作。可以根据某一列或多列进行分组,并应用聚合函数(如求和、平均值、计数等)。 7. 缺失值处理:可以使用`isnull()`和`fillna()`方法来处理缺失值。`isnull()`方法用于检测缺失值,`fillna()`方法用于填充缺失值。 8. 数据合并和连接:可以使用`merge()`和`concat()`方法将多个DataFrame进行合并和连接。`merge()`方法可以根据指定的列将两个DataFrame进行合并,`concat()`方法可以将多个DataFrame按行或列进行连接。 9. 数据可视化:Pandas提供了简单易用的数据可视化功能,可以使用`plot()`方法绘制各种类型的图表,如折线图、柱状图、散点图等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值