python查看数据集的维度、大小_Python数据分析 - numpy

前言

NUMPY(以下简称NP)是Python数据分析必不可少的第三方库,np的出现一定程度上解决了Python运算性能不佳的问题,同时提供了更加精确的数据类型。如今,np被Python其它科学计算包作为基础包,已成为Python 数据分析的基础,可以说,NP是SciPy、Pandas等数据处理或科学计算库最基本的函数功能库。因此,理解np的数据类型对python数据分析十分有帮助。

下面,本文将介绍Np的常用操作和基本数据类型。

NP提供了以下重点功能。

一个强大的N维数组对象ndarray

广功能函数

整合C/C++/Fortran代码的工具

提供了线性代数、傅里叶变换、随机数生成的相关功能

为了更加直观的了解Np的强大与作用,我们先看作用再看方法:

使用NUMPY操作数据集

在操作数据之前,我们先来理解什么是维度:

什么是维度

维度是一组数据的组织形式,不同数据维度可能表示不同的含义。

一维数据由对等关系的有序或无序数据构成,采用线性方式组织,可以用数组表示。

通俗来讲,

1,2,3,4

这么一行数据就可以称之为一维数据,但如果我们再对其折叠:

1,2,

3,4

那么他就成为了二维数据,又可以称之为矩阵。

什么是数据集

数据集,顾名思义就是数据的集合,是用以训练程序的数据集合,一般是二维或者多维数表。

如果我们想自己手工新建一个数据集,可以直接新建一个文本文件,只要有恰当的数据,都可以称之为数据集:

城市,环比,同比,定基

北京,100.1,100.2,100.3

上海,111.1,111.2,111.3

南京,133.0,133.3,133.4

比如这样,我们就可以称上面的文件称之为数据集。

我们还注意到,上面数据是使用逗号作为分隔符分隔数据的,它简单描述了数据的内容和含义,并使用半角逗号作为分隔符。

像这样,用逗号分隔的数据集就称之为CSV(Comma-Separated Value,逗号分隔值)数据集,它是一种常见的文件格式,用来存储批量的数据。它就像一张excel表,用来存储简单结构的数据。

怎么样,数据集的概念是否特别简单呢?

生成数据集

数据集是一个简单的概念,但每次使用手工的方式去写毕竟不方便,所以,我们可以使用np的内置函数来生成数据集:

np.savetxt(frame,array,fmt='%.18e",delimiter=None)

frame:文件、字符串

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值