#cda学习打卡 #cda-python数据分析 第二次打卡

本文介绍了Pandas,一个强大的Python数据分析库,包括其基于NumPy的基础、主要数据结构(Series和DataFrame)、数据类型、查看方法(如head、columns等)、条件查询以及数据操作功能,如函数应用和行级应用。
摘要由CSDN通过智能技术生成

一、Pandas简介

Pandas是一个开源的Python数据分析库,提供了高性能、易于使用的数据结构和数据分析工具。它是基于NumPy构建的,主要用于数据清洗和分析。Pandas的主要数据结构有两种:Series(一维)和DataFrame(二维)。

二、Pandas数据类型

  1. 数值型:int、float
  2. 字符串型:object
  3. 布尔型:bool
  4. 时间序列:datetime64
  5. 分类数据:category

三、Pandas数据查看

  1. 查看前n行或后n行数据:df.head(n) 或 df.tail(n)
  2. 查看列名:df.columns
  3. 查看索引:df.index
  4. 查看数据形状:df.shape
  5. 查看数据信息:df.info()
  6. 查看数据描述性统计:df.describe()
  7. 查看某一列的数据类型:df['column_name'].dtype

四、Pandas条件查询

  1. 基于条件筛选行:df[df['column_name'] > value]
  2. 基于多个条件筛选行:df[(df['column1'] > value1) & (df['column2'] < value2)]
  3. 对某一列应用函数:df['column_name'].apply(function_name)
  4. 对DataFrame的每一行应用函数:df.apply(function_name, axis=1)

import pandas as pd

# 创建一个DataFrame
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)

# 查看前2行数据
print(df.head(2))

# 查看列名
print(df.columns)

# 查看索引
print(df.index)

# 查看数据形状
print(df.shape)

# 查看数据信息
print(df.info())

# 查看数据描述性统计
print(df.describe())

# 查看某一列的数据类型
print(df['A'].dtype)

# 基于条件筛选行
print(df[df['A'] > 1])

# 基于多个条件筛选行
print(df[(df['A'] > 1) & (df['B'] < 6)])

# 对某一列应用函数
print(df['A'].apply(lambda x: x * 2))

# 对DataFrame的每一行应用函数
print(df.apply(lambda x: x.sum(), axis=1))

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值