昨天有个数据分析的小学弟问了我read_excel这个方法的相关参数。我。。。。。啊?这个不是从Excel中读取数据吗?有什么参数设置 ̄□ ̄|| ̄□ ̄||(因为我学数据分析的时候一直用的就是read_csv(/ω\)(/ω\))
小事情,小事情,不就一个read_excel嘛,谁还搞不定了??????(へ´*)ノ(
へ´*)ノ
先来看他的源码:
pandas.read_excel(io,sheet_name = 0,header = 0,names = None,index_col = None,usecols = None,squeeze = False,dtype = None, ....)
调用pandas中的read_excel方法,总要来点要求吧!嗯哼,接好了~~~~~~
首先是 io:一个要求以字符串形式出现的路径。( ̄□ ̄|| ̄□ ̄||,好像一般路径都是字符串类型哦!啊哈哈哈哈哈嗝)
sheet_name:数据类型可以是None,string,int,字符串列表或者是整数列表,默认为0。字符串用于工作表名称,整数用于零索引工作表位置,字符串或者整数列表用于请求多个工作表,为None时获取所有的工作表。
当sheet_name=0的时候表示使用第一张表作为DataFrame(学数据分析的小伙伴们,DataFrame知道是什么吗?(/ω\)(/ω\)。昨天,小学弟也问我了。啊~~~~~~他是pandas中的一种数据类型,还有一个是Series,不同的是Series是一维的数据,DataFrame是多维的,他可以看做是Series的升级版)
又呱呱了一大堆,接着。。。。。。
当sheet_name=1的时候表示使用第二张表作为DataFrame
当sheet_name='Sheet1’也是表示使用第一张表作为DataFrame(小伙伴们,Sheet工作表知道吧!如果你以后想要从事数据分析这个方向,重要的不止数据库,还有Excel,PPT,等等一大堆乱起八遭的东西。。。。。但说句实话,咱人工智能这个专业,走数据分析这个方向还是蛮好的)
sheet_name=[0,1,‘sheet5’]表示选取第一页,第二页和第五页作为DataFrame的字典
header:指定作为列名的行,默认为0,即选取第一行的值为列名。数据为列名行一下的数据。若数据不含列名,则设定header=None
names:默认为None,要使用的列名列表,如不包含标题行,应传递header=None
index_col:指定列为索引值,默认None列(0索引)用作DataFrame的行标签
usecols:int或者list型的数据。默认为None
如果为None则解析所有的行
如果为int则表示要解析最后一行
如果为int列表则表示要解析的列号列表
如果字符串则表示以逗号分隔的Excel列字母和列范围列表。范围包括双方
squeeze:boolean,默认为False。如果解析的数据只包含一行,则返回一个Series
dtype:列的类型或字典。int32,float64等等
skiprows:省略指定行数的数据,从第一行开始
skipfooter:省略指定行数的数据,是从尾部数的行开始。
好了,大家下去慢慢记吧!(/≧▽≦)/(/≧▽≦)/