本文参照油管的一个pandas的系列教程:
https://www.youtube.com/watch?v=ZyhVh-qRZPA&list=PL-osiE80TeTsWmV9i9c58mdDCSskIFdDSwww.youtube.com-----
导入pandas并且读取文件
导入的时候把第一列设置为index
查看行数和列数
FILTER篇
在特定列中选出符合标准的行,方法#1。
在filter中用&:
用or:
在特定列中选出符合标准的行,方法#2
在特定列中选出符合标准的行#3。适用于选择一系列特定的基因。
在特定列中选出符合标准的行#4。string中包含关键字,且不算空白单元NA。
替换数据篇
替换列的名字。
另一种方式替换。
把列的名字大写化。
把列的部分名字进行替换。
替换某列的名字。
替换行的内容。
替换行的内容#2。
替换某行某列。先行后列。
替换某行某列#2。先列后行。
将某列内容小写化。
运用apply()把某列内容更改。
把某列内容的yes 和no替换成True和False。map的功能和replace相似,用map的原因是这列只有yes和no,这里的map也可以换成replace。
增加或减少列/行/df
将两列内容合并,并另起一列。
去掉特定列。
将某列以空格为分界线拆成两列,并添加进df。
添加新行的内容。注意ignore_index=True,因为有一些信息为空白。
添加另一个df。
去掉特定行。#用index数。
去掉特定行。#用filter。
排序篇
先排last降序,后排first升序。
保存的话加inplace=True
按index排序。
按某列内的值排序#1。
按某列内的值排序#2。
按某几列内的值排序#3。先排country升序,后排ConvertedComp降序。
查看某列最大的10个数。只显示index和数,没有其他信息。
查看这10个数的行。除了index和数,还有其它信息。nlargest也可以换成nsmallest。
---
保存csv格式