numpy（二）、pandas

·w·920

已于 2023-09-24 21:18:02 修改

阅读量43

点赞数

文章标签： numpy pandas

于 2023-09-24 21:13:06 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_63697837/article/details/133250240

版权

numpy

数组的拼接

数组的行列交换

竖直拼接的时候要注意：每一列代表的意义相同，若每一列的意义不同，这时应该交换某一组数的列，让其和另外一类相同

numpy更多好用的方法

numpy生成随机数

numpy的注意点copy和view

1.a=b完全不复制，a和b相互影响

2.a=b[:]，视图的操作，一种切片，会创建新的对象a，但是a的数据完全由b保管，它们两的数据变化是一致的

3.a=b.copy()，复制，a和b互不影响

numpy中常用统计函数

（标准差是一组数据平均值分散程度的一种度量，一个较大的标准差，代表大部分数值和其平均值之间差较大，一个较小的标准差代表这些数值较接近平均值，反映出数据的波动稳定情况，越大表示波动越大，越不稳定）

numpy中的nan和inf

nan：not a number表示不是一个数字

出现nan的情况：当读取本地的文件位float的时候，如果有缺失，就会出现nan；当做了一个不合适的计算的时候（比如无穷大（inf）减去无穷大）

inf(-inf,inf):infinity，inf表示正无穷，-inf表示负无穷

出现inf（包括-inf，+inf）的情况：比如一个数字除以0（python中会直接报错），numpy中是一个inf或者-inf

nan

如果在一组数据中单纯把nan替换为0，替换之前的平均值如果大于0，替换之后的均值肯定会变小，所以更一般的方式是把缺失的数值替换为均值（中值）或者是直接删除有缺失值的一行

总结

pandas

pandas的常用数据类型：

1.Series 一维，带标签数组

2.DataFrame 二维，Series容器

Series

Series创建

Series切片和索引

Series的索引和值

Series对象本质上由两个数组构成，一个数组构成对象的键（index，索引），一个数组构成对象的值（values），键->值

pandas读取外部数据

数据存在csv中，直接使用pd.read_csv即可

数据库比如mysql中的数据的使用方法：pd.read_sql(sql_sentence.connection)

DataFrame

DataFrame创建

DataFrame基本属性

取行或者列

取前20行的数据

取列的数据

注意点：

1.方括号写数字，表示取行，对行进行操作

2.写字符串，表示取列索引，对列进行操作

loc和iloc

布尔索引

如果有多个条件，条件需要分开写（用&（且）｜（或）符号）

不同的条件之间需要用括号括起来

字符串方法

对于缺失数据的处理

判断数据是否为NaN：pd.isnull(df),pd.notnull(df)

处理方法1:删除NaN所在的行列dropna（axis=0,how='any',inplace=False）

处理方法2:填充数据，t.fillna(t.mean()),t.fiallna(t.median()),t.fillna(0)

处理为0的数据：t[t==0]=np.nan

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

·w·920 CSDN认证博客专家 CSDN认证企业博客

码龄3年

18: 原创

143万+: 周排名

129万+: 总排名

914: 访问

: 等级

180: 积分

1: 粉丝

0: 获赞

13: 评论

0: 收藏

私信

关注

热门文章

最新评论

matplotlib（二）、numpy（一）
CSDN-Ada助手: 恭喜您写了第9篇博客！标题看起来非常有趣，我很期待阅读您关于matplotlib和numpy的内容。您对这两个主题的深入探索将为读者提供宝贵的知识。希望您能继续保持创作的激情和努力，为我们带来更多精彩的博客内容。如果可能的话，我建议您考虑在未来的创作中结合实际案例来展示matplotlib和numpy的应用。这将帮助读者更好地理解这两个库的潜力和实用性。再次恭喜您，并期待您的下一篇博客！
numpy（二）、pandas
CSDN-Ada助手: 恭喜用户写了第10篇博客！标题“numpy（二）、pandas”听起来很有趣。您对numpy和pandas的深入探索让人印象深刻。您的博客是我学习数据处理的重要参考资料之一。希望您能继续创作下去，分享更多关于数据处理的知识和技巧。如果我可以提一个谦虚的建议的话，我认为将一些实际案例或者示例代码融入到您的博客中，将会更加生动有趣，也更容易让读者理解和应用。期待您的下一篇博客！
机器学习（七）
CSDN-Ada助手: 恭喜您写了第17篇博客！您的坚持和努力可嘉。标题为“机器学习（七）”的博客引人入胜，我非常期待能够阅读您的深入研究。在下一篇博客中，或许您可以探讨一些实际应用案例，以及机器学习在解决现实问题中的潜力。希望您能继续保持谦虚的态度，分享您的见解并激发我们的思考。期待您的下一篇作品！
机器学习（八）
CSDN-Ada助手: 恭喜您写了第18篇博客！阅读您的文章，我对您的深度探讨和研究感到非常欣赏。您对机器学习的理解和运用能够给读者提供宝贵的见解和指导。希望您能继续保持创作的热情和努力，分享更多关于机器学习的知识和经验。或许下一步，您可以考虑探讨一些实际案例或应用场景，这样读者们将更容易将学到的理论知识与实际问题相结合。再次感谢您的付出，期待您未来更多精彩的博客！
机器学习（五）
CSDN-Ada助手: 恭喜您写了第15篇博客！看到您对机器学习的持续创作，我真的感到非常高兴。您的文章标题“机器学习（五）”似乎意味着您已经有了很多关于机器学习的知识和经验。希望您能继续分享自己的见解和学习心得，因为我深信您的经验将会对读者们产生深远的影响。在下一步的创作中，或许您可以考虑分享一些实际案例或者应用场景，这样读者们可以更好地理解机器学习在现实生活中的应用。同时，如果您能分享一些挑战和困惑，以及您是如何克服它们的，那将会使您的博客更加丰富和有趣。谦虚地说，我相信您的创作将继续给读者们带来新的启发和思考。祝愿您在未来的写作中取得更大的成就！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。