本次学习有几点收获,写在下面
1.关于read_csv和read_table的区别
read_csv和read_table的区别在于separator分隔符。
csv是逗号分隔值(Comma-Separated Values),仅能正确读入以 “,” 分割的数据。read_table的分隔符是tab
TSV文件与CSV文件的区别
TSV 是Tab-separated values的缩写,即制表符分隔值。
相对来说CSV,Comma-separated values(逗号分隔值)更常见一些。
TSV与CSV的区别:
1)从名称上即可知道,TSV是用制表符(Tab,’\t’)作为字段值的分隔符;CSV是用半角逗号(’,’)作为字段值的分隔符;
2)IANA规定的标准TSV格式,字段值之中是不允许出现制表符的。
因此,一般read_table读取的是tsv文件,read_csv读取的是csv文件。
2.df.head()和df.tail()
分别查看前X行数据和后X行数据
3.DataFrame删除行和列的方式
删除多余的列
方式1:del test_1[‘a’]
方式2:
test_1.drop([“a”],axis = 1)
其中,axis=0代表删除行
区别:del在原始表格中改动,而drop不改变原表
如果drop需要改变原表,则增加参数inplace = True
4.关于loc和iloc区别
loc的参数必须是表格中的名称,而iloc的参数为表格中的索引。
此外,当取某几个值时,用单括号[],当取一系列值时,去掉单括号。
例子: