解决Python Array 中出现‘e+’问题（已解决）

我唯一热爱的只有金钱's NOTES

已于 2024-03-17 21:01:19 修改

阅读量877

点赞数 22

文章标签： python numpy pandas

于 2024-03-17 20:55:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/A_AHermann/article/details/136764897

版权

本文探讨了在Python numpy数组中遇到科学计数法（e+）表示的问题，特别是在深度学习场景下。文章分析了e+出现的原因，包括数据长度、切片操作和四舍五入的影响，并提出了两种解决方案：简单四舍五入和使用numpy的set_printoptions。通过调整精度设置，可以避免数据的显示问题，同时在必要时保持数值计算的准确性。

摘要由CSDN通过智能技术生成

形如：arr = np.array([1.23e+06, 4.56e+07, 7.89e+08])
(以上代码来自百度AI助手)
这样的数据出现在将要用于深度学习模型训练的时候该如何处理？

PS：本文中出现的代码不能直接运行，仅作为描述辅助用途。本文中出现的数据集将不会在此上传，截取极小片段仅单纯作为说明python使用过程中的问题及其潜在解决方案的示例以便于理解。

问题描述

提示：这里描述项目中遇到的问题：

数据集已转化为二维数组，数据类型为np.float32, 存放于python numpy array 中。当通过array 行列索引某一行某一列的单一数据时，Jupyter notebook返回值不显示e+, 但是当通过array 行列索引切片读取多行多列数据时，Jupyter note book 会显示e+, 并且数据中的小数点向前移动一位，即原数据-39.0000e+04会变成-3.9000e+04而不是预期中的-39.01. 如下所示：

当在Jupyter notebook中读取array形式的数据集时：

 # test1_copy是文件中的数据
tt = np.array(test1_copy)
np.float32(tt)

由于数据集敏感性问题，仅仅截取具有对单纯解决python技术应用相关的本文具有说明性的一小段作为参考:

array([[ -1.98,  -5.87, -39.01, ..., -15.35,  -4.52,  -0.39],

注意第三个数据，-39.01此时为正常显示数据。这一段数据仅仅是显示的整个数据集中的一条数据的一部分，但是如果想要只查看第一条数据：

tt[0] #第一行数据

在Jupyter notebook中将会看到：

#这是第一个数据中的一部分
array([-1.98000e+00, -5.87000e+00, -3.90100e+01,  1.52400e+02,

此时查看对应的第三个数据集，原显示数据-39

最低0.47元/天解锁文章

我唯一热爱的只有金钱's NOTES

关注

22
点赞
踩
20

收藏

觉得还不错? 一键收藏
打赏
0
评论
解决Python Array 中出现‘e+’问题（已解决）

(以上代码来自百度AI助手)这样的数据出现在将要用于深度学习模型训练的时候该如何处理？PS：本文中出现的代码不能直接运行，仅作为描述辅助用途。本文中出现的数据集将不会在此上传，截取极小片段仅单纯作为说明python使用过程中的问题及其潜在解决方案的示例以便于理解。
复制链接

扫一扫

我唯一热爱的只有金钱's NOTES

CSDN认证博客专家 CSDN认证企业博客

码龄5年

10: 原创

139万+: 周排名

10万+: 总排名

7177: 访问

: 等级

173: 积分

56: 粉丝

73: 获赞

0: 评论

72: 收藏

私信

关注

热门文章

分类专栏

最新评论

测试并解决10w个Parquet文件批量读取并使Jupyter Notebook 不罢工的问题
CSDN-Ada助手: 恭喜作者第四篇博客的成功发布！解决10w个Parquet文件批量读取并保持Jupyter Notebook稳定运行的问题确实是一个不容易的挑战，你的经验分享对于读者们无疑是非常有帮助的。希望你能继续分享更多关于数据处理和技术优化方面的经验，也许可以考虑写一些关于数据可视化或者机器学习应用的内容，让读者们能够更全面地了解数据科学的方方面面。期待你的下一篇作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
解决Python Array 中出现‘e+’问题（已解决）
CSDN-Ada助手: 恭喜您解决了Python Array中出现‘e+’问题，这篇博客对于遇到相同问题的读者们来说肯定非常有帮助！希望您能继续保持创作的热情和努力，分享更多有趣且实用的技术经验。或许下一步可以尝试分享一些高级技巧或者深入研究某个特定主题，期待您的更多精彩内容！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Python读取.parquet文件
CSDN-Ada助手: 很棒的分享！学会如何使用Python读取.parquet文件对数据处理和分析都是非常有用的。希望你能继续分享更多关于数据处理和Python的知识。另外，除了读取.parquet文件，你还可以学习如何对parquet文件进行写入和修改，以及如何进行parquet文件的压缩和优化，这些都是非常有用的扩展知识。加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
Pandas df.iloc/df.loc 等方法在大型数据集上采用for 循环读取数据速度慢
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

我唯一热爱的只有金钱's NOTES 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。