数据分析:Task1-数据加载及探索性分析

本次学习有几点收获,写在下面

1.关于read_csv和read_table的区别

read_csv和read_table的区别在于separator分隔符。
csv是逗号分隔值(Comma-Separated Values),仅能正确读入以 “,” 分割的数据。read_table的分隔符是tab
TSV文件与CSV文件的区别
TSV 是Tab-separated values的缩写,即制表符分隔值。
相对来说CSV,Comma-separated values(逗号分隔值)更常见一些。
TSV与CSV的区别:
1)从名称上即可知道,TSV是用制表符(Tab,’\t’)作为字段值的分隔符;CSV是用半角逗号(’,’)作为字段值的分隔符;
2)IANA规定的标准TSV格式,字段值之中是不允许出现制表符的。

因此,一般read_table读取的是tsv文件,read_csv读取的是csv文件。

2.df.head()和df.tail()

分别查看前X行数据和后X行数据

3.DataFrame删除行和列的方式

删除多余的列
方式1:del test_1[‘a’]

方式2:
test_1.drop([“a”],axis = 1)

其中,axis=0代表删除行

区别:del在原始表格中改动,而drop不改变原表
如果drop需要改变原表,则增加参数inplace = True

4.关于loc和iloc区别

loc的参数必须是表格中的名称,而iloc的参数为表格中的索引。

此外,当取某几个值时,用单括号[],当取一系列值时,去掉单括号。
例子:
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值