matplotlib数据可视化分析(2)-- numpy将数组存储到文件

转载: https://blog.csdn.net/u010089444/article/details/52738479

1 数组以二进制的格式保存

np.save 和 np.load 是读写磁盘数据的两个主要函数。默认情况下,数组以未压缩的原始二进制格式保存在扩展名为 npy 的文件中,以数组 a 为例:

# coding:utf-8
import numpy as np

c = np.random.randint(0, 101, 10)
print c
np.save('c.npy', c)
c1 = np.load('c.npy')
print c1

利用这种方法,文件的后缀名字一定会被设置为 .npy

2. 存取文本文件

使用 np.savetxt 和 np.loadtxt 只能读写 1 维和 2 维 的数组
np.savetxt :将数组写入以某种分隔符隔开的文本文件中
np.loadtxt : 指定某种分隔符,将文本文件读入到数组中

# coding:utf-8
import numpy as np

c = np.random.randint(0, 101, 10)
print c
np.savetxt('c.txt', c)
c1 = np.loadtxt('c.txt', delimiter=',')
print c1

保存为二进制文件

使用数组的 tofile 函数可以方便地把数组中数据以二进制的格式写进文件

# coding:utf-8
import numpy as np

c = np.random.randint(0, 101, 10)
print c
c.tofile('c.bin')
c1 = np.fromfile('c.bin', dtype=None)
print c1

该方法与np.save有几点区别:

  1. tofile函数只能将数组保存为二进制文件,文件后缀名没有固定要求。这种保存方法对数据读取有要求,np.fromfile 需要手动指定读出来的数据的的dtype,如果指定的格式与保存时的不一致,则读出来的就是错误的数据。
  2. tofile函数不能保存当前数据的行列信息,不管数组的排列顺序是C语言格式的还是Fortran语言格式,统一使用C语言格式输出。因此使用 np.fromfile 读出来的数据是一维数组,需要利用reshape指定行列信息。

举例:

# coding:utf-8
import numpy as np

a = np.arange(0, 12)
a.shape = 3, 4
print a
# [[ 0  1  2  3]
#  [ 4  5  6  7]
#  [ 8  9 10 11]]
a.tofile('a.bin')
b = np.fromfile('a.bin', dtype=np.float)
# 这是读入的数据是错误的
print b
print a.dtype
# int64

# 按照 int64 类型读入数据
b = np.fromfile('a.bin', dtype=np.int64)
print b
# 按照 a 的 shape 修改 b 的 shape
b.shape = 3, 4
print b
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Python大作业数据分析通常会使用到numpymatplotlib和爬虫技术。下面我详细介绍一下: 1. NumpyNumpy是Python中常用的数值计算库,它提供了对多维数组对象的支持以及一系列科学计算函数。在数据分析中,我们可以使用numpy来进行数据处理、数据清洗、数据转换等操作。例如,我们可以使用numpy来进行数组运算、矩阵计算、向量操作等,大大提高了运算效率和开发速度。 2. MatplotlibMatplotlib是Python中广泛使用的数据库,它可以用来绘制各种类型的图表,如折线图、柱状图、饼图、散点图等。在数据分析中,我们可以使用matplotlib来展示和探索数据的分布、关系和趋势,帮助我们更好地理解数据。例如,我们可以使用matplotlib来绘制销售趋势图,比较不同产品的销售情况等。 3. 爬虫:爬虫是一种自动获取网页信息的技术,通过模拟浏览器行为并提取网页中的数据,可以获取大量的结构数据。在数据分析中,我们可以使用爬虫技术来从各种数据源(如网页、API、数据库等)中获取数据,以便进行后续的分析和处理。例如,我们可以编写爬虫程序来爬取电商网站的商品信息,然后使用numpymatplotlib对这些数据进行分析和可。 综上所述,Python大作业数据分析常使用numpymatplotlib和爬虫技术,它们分别用于数据处理、数据数据获取方面,为我们提供了强大的分析工具和方法。 ### 回答2: Python大作业数据分析主要涉及到了三个重要的模块:NumPyMatplotlib和爬虫。 首先是NumPy,它是一个强大的Python科学计算库。我们可以使用NumPy来处理和分析大量的数据。它提供了高效的数组运算和数值计算的功能,可以进行数据处理、转换、矩阵运算等。在数据分析中,可以利用NumPy来进行数据预处理、数据清洗、数据变换等操作。 其次是Matplotlib,这是一个用于创建各种类型图表和可的Python绘图库。我们可以使用Matplotlib来绘制图表、直方图、散点图、饼图等,以直观的方式展示数据分析结果。Matplotlib不仅可以用于静态图表的绘制,还可以创建动态图表和交互式图表,使得数据呈现更加生动。 最后是爬虫,也就是利用Python编写程序从网页上获取所需数据的技术。爬虫可以通过发送HTTP请求,解析HTML文档,提取所需数据并保存到本地或进一步处理。在数据分析中,我们可以使用爬虫来获取特定网站上的数据,例如股票价格,天气信息等,从而进行后续的数据分析和处理。 综上所述,Python大作业数据分析涉及到的关键技术主要是NumPyMatplotlib和爬虫。通过利用这些技术,我们可以对大量数据进行处理、分析和可呈现,从而得出有意义的结论和结果。 ### 回答3: Python大作业数据分析主要涉及到numpymatplotlib和爬虫技术。 首先,numpy是Python科学计算的基础库,它提供了多维数组对象和一些用于处理数组的函数。在数据分析中,可以使用numpy进行数据存储、处理和计算,如数据清洗、分析、转换等。通过numpy数组对象,可以方便地进行向量计算,加快数据处理的速度。 其次,matplotlib是一个可库,它能够将数据以图表的形式展示出来。在数据分析中,我们可以使用matplotlib绘制各种类型的图表,如柱状图、折线图、散点图等,以便更直观地展示数据的特征和趋势。通过调用matplotlib的API,可以自定义图表的外观和样式,使其更符合数据分析的需要。 最后,爬虫技术是通过模拟HTTP请求,从网页中提取数据的一种技术。在数据分析中,我们可以使用爬虫技术从互联网上获取所需的数据,如股票数据、天气数据、新闻数据等,以便进行后续的分析和处理。通过合理的选择爬虫库和编写爬虫脚本,可以高效地获取到所需的数据。 综上所述,Python大作业数据分析主要涉及到numpymatplotlib和爬虫技术。通过numpy进行数据的处理和计算,使用matplotlib进行数据的可,以及利用爬虫技术获取所需的数据。通过综合运用这些技术,可以对数据进行深入的分析和挖掘,发现数据中的规律和趋势,为决策提供有力的支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值