继续这个系列。我们导入了数据,接下来做一下基本的查看。
Python
我们的处理对象依然是DataFrame对象df。
首先使用head()函数(或tail()函数)查看最前(最后)的5条记录,获取粗略的了解,当然如果不想要5条可以向函数传入你想要的条数:
df.head()
接着推荐使用info()函数来得到数据的总体信息:
df.info()
将会显示数据的列名表(包括列中的非值个数,以及各列的数据类型),记录的行数,以及使用的内存大小。
如果不用info()函数,以下各个属性的获取:数据维度(行列):使用shape属性,返回一个元组(行数,列数)
df.shape
2. 列名表:使用columns属性,返回一个索引对象,内含列名表。
df.columns
3. 查看各列数据格式:使用dtypes属性,返回各列的数据属性。
df.dtypes
EXCEL
数据形状
当然可以使用函数来计数,但是有一个简单的方法,快捷键Ctrl+Down,可快速地跳到本列有数据的最后一个单元格,一般我们使用第一行作为列名,那么最后一个单元格行数减一就是记录条数。快捷键Ctrl+Up,快捷键Ctrl+Right以及快捷键Ctrl+Left同理。
这里需要注意隐藏行和隐藏列,可能会造成不便:开始-单元格-格式-隐藏和取消隐藏-取消隐藏行(列)
2. 字段信息
选中某一列,在开始-数字中可以查看此列的数据类型。
SPSS
数据形状
可以使用类似Excel的快捷键来完成。
2. 字段信息
在数据编辑器页面左下角,点击选择【变量视图】,即可得到变量的详细信息。也可使用快捷键Ctrl+T达到一样的目的。
SQL
1.数据形状
查看有多少记录:
select count(某字段) from 表名;
查看有多少字段:
select count(*) from information_schema.columns
where table_schema='数据库名' and table_name='表名';
MySQL中的information_schema数据库保存着关于数据库的信息。
2. 字段信息
查看字段信息:
select * from information_schema.columns
where table_name='表名';
另外,在Navicat中也可以右键点击表-设计表,来查看字段信息。