python-Pandas库学习笔记

本文详细介绍了Python中的Pandas库,包括Series和DataFrame两种核心数据结构,如何处理CSV和JSON文件,以及如何进行数据清洗,是学习数据分析和数据挖掘的重要参考资料。
摘要由CSDN通过智能技术生成

Pandas 数据结构 - Series

import pandas as pd

# Pandas Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型
# Series 由索引(index)和列组成
a = [1, 2, 3]
myvar = pd.Series(a)
print(myvar)
# 如果没有指定索引,索引值就从 0 开始,我们可以根据索引值读取数据
a = [1, 2, 3]
myvar = pd.Series(a)
print(myvar[1])
# 可以指定索引值
a = ["Google", "Runoob", "Wiki"]
myvar = pd.Series(a, index=["x", "y", "z"])
print(myvar)
# 根据索引值读取数据
print(myvar["y"])
# 可以使用 key/value 对象,类似字典来创建 Series
sites = {
   1: "Google", 2: "Runoob", 3: "Wiki"}  # 字典的 key 变成了索引值。
myvar = pd.Series(sites)
print(myvar)
myvar = pd.Series(sites, index=[1, 2])
print(myvar)
# 设置 Series 名称参数
myvar = pd.Series(sites, index=[1, 2], name="RUNOOB-Series-TEST")
print(myvar)

Pandas 数据结构 - DataFrame

# DataFrame 是一个表格型的数据结构,它含有一组有序的列,
# 每列可以是不同的值类型(数值、字符串、布尔型值)。
# DataFrame 既有行索引也有列索引,
# 它可以被看做由 Series 组成的字典(共同用一个索引)。
import pandas as pd

# Pandas DataFrame 是一个二维的数组结构,类似二维数组
data = [['Google', 10], ['Runoob', 12], ['Wiki', 13]]
df = pd.DataFrame(data, columns=['Site', 'Age'], dtype=float)
print(df)
# 使用 ndarrays 创建,ndarray 的长度必须相同,
# 如果传递了 index,则索引的长度应等于数组的长度。
# 如果没有传递索引,则默认情况下,索引将是range(n),其中n是数组长度。
data = {
   'Site': ['Google', 'Runoob', 'Wiki'], 'Age': [10, 12, 13]}
df = pd.DataFrame(data)
print(df)  # DataFrame 数据类型一个表格,包含 rows(行) 和 columns(列)
# 还可以使用字典(key/value),其中字典的 key 为列名
data = [{
   'a': 1, 'b': 2}, {
   'a': 5, 'b': 10, 'c': 20}]  # 没有对应的部分数据为 NaN
df = pd.DataFrame(data)
print(df)
# Pandas 可以使用 loc 属性返回指定行的数据,如果没有设置索引,第一行索引为 0,第二行索引为 1
data = {
   
    "calories": [420, 380, 390],
    
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

勤奋努力的野指针

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值