有java python 大数据 爬虫问题可以联系我
QQ :940947367
微信:shijunchuan002
- 读excel
pd.read_excel(io, sheetname=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, parse_cols=None, parse_dates=False, date_parser=None, na_values=None, thousands=None, convert_float=True, has_index_names=None, converters=None, dtype=None, true_values=None, false_values=None, engine=None, squeeze=False, **kwds)
‘’’
该函数主要的参数为io、sheetname、header、names、encoding。
io:excel文件,可以是文件路径、文件网址、file-like对象、xlrd workbook;
sheetname:返回指定的sheet,参数可以是字符串(sheet名)、整型(sheet索引)、list(元素为字符串和整型,返回字典{‘key’:‘sheet’})、none(返回字典,全部sheet);
header:指定数据表的表头,参数可以是int、list of ints,即为索引行数为表头;
names:返回指定name的列,参数为array-like对象。
encoding:关键字参数,指定以何种编码读取。
该函数返回pandas中的DataFrame或dict of DataFrame对象,利用DataFrame的相关操作即可读取相应的数据。
‘’’
#代码示例:
import pandas as pd
import pandas as pd
//读取18 和19列
houseDF = pd.read_excel(’./house.xlsx’, sheetname=‘Data’,usecols=[18,19])
print(houseDF.head(5))
2.读csv
指定编码是ANSI,可以用notepad++查看csv格式
data = pd.read_csv(’./mashup_data.csv’,usecols=[0],encoding=‘ANSI’)
pd.read_csv(r’./data/takehome_contacts.csv’) 默认第一行是列名
读取第0,1,2,3列的内容
data = pd.read_csv(‘data.csv’,usecols=[0,1,2,3])