“第二课堂”AI实践笔记2

最新推荐文章于 2024-10-04 22:36:54 发布

2301_80289073

最新推荐文章于 2024-10-04 22:36:54 发布

阅读量354

点赞数 3

文章标签：人工智能笔记 pandas

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_80289073/article/details/140618699

版权

1.安装

可以通过pip安装Pandas：

bash

pip install pandas

2. 基本数据结构

Series：一维数组结构，可以存储任何数据类型。
DataFrame：二维表格型数据结构，类似于Excel中的表格，有行和列。

3. 创建数据结构

创建Series：
python

import pandas as pd s = pd.Series([1, 3, 5, np.nan, 6, 8])
创建DataFrame：
python

df = pd.DataFrame({ 'Column1': [1, 2, 3, 4], 'Column2': ['a', 'b', 'c', 'd'], 'Column3': [True, False, True, False] })

4. 读取和写入数据

读取CSV文件：
python

df = pd.read_csv('filename.csv')
写入CSV文件：
python

df.to_csv('output.csv', index=False)

5. 选择和过滤数据

选择单个列：
python

col = df['Column1']
选择多个列：
python

cols = df[['Column1', 'Column2']]
条件过滤：
python

filtered_df = df[df['Column1'] > 2]

6. 数据清洗

处理缺失值：
python

df.dropna() # 删除缺失值 df.fillna(value) # 填充缺失值
数据类型转换：
python

df['Column1'] = df['Column1'].astype(int)

7. 数据操作

数据排序：
python

sorted_df = df.sort_values(by='Column1')
数据分组：
python

grouped = df.groupby('Column1')
数据合并：
python

merged_df = pd.merge(df1, df2, on='key_column')

8. 数据分析

描述性统计：
python

descriptive_stats = df.describe()
相关性分析：
python

correlation_matrix = df.corr()

9. 时间序列

处理时间数据：
python

df['date_column'] = pd.to_datetime(df['date_column'])
时间索引：
python

df.set_index('date_column', inplace=True)

10. 绘图

Pandas可以与Matplotlib库结合，为数据提供可视化：

python

import matplotlib.pyplot as plt df['Column1'].plot(kind='line') plt.show()

11. 性能优化

使用categorical数据类型来优化内存使用：
python

df['categorical_column'] = df['categorical_column'].astype('category')
使用eval或query方法进行复杂条件的快速评估。

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。