【实战指南】揭秘Pandas：从零开始掌握数据处理与分析的超级工具箱

AI_茗

于 2024-07-10 11:27:30 发布

阅读量608

点赞数 16

文章标签： pandas python nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_71212744/article/details/140318983

版权

目录

创建 DataFrame

读取 CSV 文件

写入 CSV 文件

查看前几行:

查看后几行:

描述性统计:

Pandas 是一个强大的 Python 库，主要用于数据分析和数据处理。它提供了两种主要的数据结构：Series 和 DataFrame。

Series

Series 是一个一维的标签数组，它可以容纳任何数据类型（整数、字符串、浮点数、Python对象等）。Series 的轴标签统称为索引

创建 Series

import pandas as pd

# 使用列表创建 Series
s = pd.Series([1, 3, 5, np.nan, 6, 8])

访问数据

# 访问第一个元素
print(s[0])

# 切片访问多个元素
print(s[0:3])

DataFrame

DataFrame 是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔值等）。DataFrame 的轴索引包括行索引和列索引。

创建 DataFrame

data = {'Name': ['Tom', 'Nick', 'John', 'Tom'],
        'Age': [20, 21, 19, 20]}
df = pd.DataFrame(data)

读取 CSV 文件

df = pd.read_csv('path/to/yourfile.csv')

写入 CSV 文件

df.to_csv('path/to/newfile.csv', index=False)

基本操作

查看前几行:

  print(df.head())

查看后几行:

  print(df.tail())

描述性统计:

  print(df.describe())

选择列:

  print(df['Name'])

选择行:

  print(df[df['Age'] > 20])

条件筛选:

  mask = df['Name'] == 'Tom'
  print(df[mask])

排序:

  print(df.sort_values(by='Age'))

合并数据:

  df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
                      'B': ['B0', 'B1', 'B2', 'B3'],
                      'key': ['K0', 'K1', 'K0', 'K1']})
  
  df2 = pd.DataFrame({'C': ['C0', 'C1'],
                      'D': ['D0', 'D1']},
                     index=['K0', 'K1'])
  
  result = pd.merge(df1, df2, left_on='key', right_index=True)

关注

16
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

AI_茗 CSDN认证博客专家 CSDN认证企业博客

码龄2年

63: 原创

30万+: 周排名

2万+: 总排名

7万+: 访问

: 等级

1457: 积分

668: 粉丝

819: 获赞

5: 评论

614: 收藏

私信

关注

热门文章

分类专栏

pip 2篇

最新评论

【机器学习】-- SVM核函数（超详细解读）
m0_59916887: 无敌的描述我爱了
YOLO--置信度（超详细解读）
AI_茗: 真实框是你打的标签框，预测框是训练过程中预测的，所以iou是在训练过程中计算出来的
YOLO--置信度（超详细解读）
weixin_51009753: “在YOLO中，置信度是通过将对象存在的概率与预测框和真实框的最高IoU（如果有一个真实框与该预测框匹配）相乘来计算的。然而，在训练过程中，由于没有真实的IoU值（因为我们在训练时需要预测它），所以通常将置信度简化为对象存在的概率。在推理（测试）时，我们会使用预测的对象存在概率和预测的框与所有真实框的IoU中的最大值（如果存在匹配的真实框）来计算置信度。”这与前面的描述完全反了吧。前面说训练过程中，有真实的IoU，这里说没有真实的IoU，看的要哭了
YOLO--置信度（超详细解读）
weixin_51009753: 这段话看的我哇哇叫，哈哈哈哈，压根没法理解
一步解决Ubuntu中无法使用git clone的问题
weixin_74014931: 万分感谢

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。