Python数据分析基础知识点

阿贾克斯的黎明

于 2024-09-06 23:37:18 发布

阅读量214

点赞数 4

分类专栏： python 文章标签：信息可视化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_57836225/article/details/141978854

版权

python 专栏收录该内容

20 篇文章 0 订阅

订阅专栏

一、数据读取与导入

pandas库：
- read_csv：用于读取 CSV 文件，可指定分隔符、编码等参数。
- read_excel：读取 Excel 文件，可以选择特定的工作表。
- read_sql：从数据库中读取数据，需要连接数据库的驱动和相关配置。

二、数据探索与理解

查看数据结构：
- head()：查看数据的前几行，快速了解数据的大致样子。
- tail()：查看数据的后几行。
- shape：返回数据的行数和列数。
- columns：获取列名。
- dtypes：查看每列的数据类型。
统计信息：
- describe()：提供数值列的基本统计信息，如计数、均值、标准差、最小值、四分位数、最大值等。
缺失值检查：
- isnull()：返回一个布尔值的 DataFrame，表示每个元素是否为缺失值。
- isnull().sum()：统计每列的缺失值数量。

三、数据清洗

处理缺失值：
- dropna()：删除包含缺失值的行或列，可以指定轴（axis=0 表示行，axis=1 表示列）。
- fillna()：用特定的值、均值、中位数等填充缺失值。
处理重复值：
- drop_duplicates()：删除重复的行，可以指定考虑的列。
数据类型转换：
- astype()：将列的数据类型转换为指定类型，如将字符串转换为整数。

四、数据分析与计算

基本统计计算：
- mean()、median()、std()：分别计算均值、中位数、标准差。
- min()、max()：获取最小值和最大值。
- sum()：求和。
分组计算：
- groupby()：根据特定的列进行分组，然后可以对每组进行统计计算。
- 例如：df.groupby('category')['value'].mean()，对不同类别下的数值列求均值。
条件筛选：
- 使用布尔索引筛选满足特定条件的数据行。
- 例如：df[df['age'] > 30]，筛选出年龄大于 30 的行。

五、数据可视化

matplotlib库：
- 绘制折线图、柱状图、散点图、直方图等基本图表。
- 可以设置标题、轴标签、图例等。
seaborn库：
- 基于matplotlib构建，提供更高级的统计可视化功能。
- 如绘制箱线图、小提琴图、热力图等。

六、数据存储与导出

保存为 CSV 文件：
- to_csv()：将数据保存为 CSV 文件，可以指定文件名、分隔符等参数。
保存为 Excel 文件：
- to_excel()：保存为 Excel 文件，可以选择特定的工作表名。

阿贾克斯的黎明

关注

4
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

阿贾克斯的黎明 CSDN认证博客专家 CSDN认证企业博客

码龄3年

1102: 原创

5228: 周排名

1550: 总排名

55万+: 访问

: 等级

2万+: 积分

6202: 粉丝

9068: 获赞

3: 评论

7838: 收藏

私信

关注

热门文章

分类专栏

网络安全 263篇
前端 137篇
java 224篇
vue 63篇
运维 6篇
嵌入式 6篇
python 20篇
游戏开发 12篇
数据库 16篇
golang 116篇
面试 14篇
C++ 10篇
typescript 3篇
计算机基础 7篇
ctf 1篇
gozero 2篇
goframe开源项目 10篇
汇编语言 8篇

最新评论

美团测试开发（到店）面试经验分享
莫小夕儿呀: 美团测开一面一个多小时：测试左移，测试右移，针对微信单人视频通话设计测试用例，针对项目有什么优化策略（代码层面，数据库层面）项目遇到什么问题怎么解决，线程阻塞怎么排查怎么解决，线程池种类和使用，深拷贝和浅拷贝，知道哪些设计模式，解释乐观锁和悲观锁以及使用场景，编程算法题（反转链表），为什么选择测开，职业规划
java面试难题深度解析
天蓝999: 给力！我之前在自学精灵网站看的，面试时90%的题目都在里边
ElasticSearch 面试问题汇总
普通网友: 支持一下，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
SSH私钥泄露漏洞
普通网友: 引领技术潮流，是不可多得的好文，十分值得借鉴和参考。期待博主未来能够持续分享更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
go语言面试题
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619301071。

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。