Pandas使用笔记-持续补充
// 读取excel
df = pd.read_excel(
io, #文件路径
sheet_name=0, #读取的工作表,从0开始,(接受str, int, list)
header=0, #指定作为列索引的行,从0开始,可以指定多行,(接受int, list,None)
#header=None:表示不使用数据源中的表头
#若指定header为多行,则不能使用usecols,会报错
names=['a','b'], #将列名自定义为a,b,列名的数量必须与读取的列的数量一致
index_col=[0,1], #指定作为行索引的列,可以指定多列
usecols=None, #指定只使用哪些列,(接受list,str)
#待读取的列号必须放入列表,否则会报错
#接受str的形式为“A:C”
squeeze=False,
dtype={"a":"int32","b":"float64"}, #设置数据格式,时间周期、时间戳等
engine=None,
converters=None,
true_values=None,
false_values=None,
skiprows=None, #跳过哪些行,不读取
nrows=10, #只读取前10行
na_values=0, #处理缺失值
keep_default_na=True,
verbose=False,
parse_dates=[0,1], #尝试将0,1列数据解析为日期格式
date_parser=None,
thousands=",", #对于文本格式的数字,根据千分位分隔符,将其解析为数字格式
comment=None,
skipfooter=0,
convert_float=True, #将1.0转化为1
mangle_dupe_cols=True, #如果列名重复则自动重命名
**kwds)
1万+

被折叠的 条评论
为什么被折叠?



