需求:
现有一批Excel文件,数量比较多,需要在每个Excel文件最后加上固定的一列比如:列名time,值为某个日期2021-02-04
处理方式:
这里使用pandas对文件进行追加
首先读取文件,获取内容、行数
然后构造最后一列
最后追加写入
如下:
def add_the_last_colum(file,title,value):
data = pd.read_excel(file)
row = data.shape[0]
if row > 0:
data[title] = [value for v in range(row)]
data.to_excel(file, index=False)
这种方法确实有效的对文件进行了,末尾追加,而且效率很高,但是问题来了
文中有一个字段原本是数值类型的字符串,比如商品id:4588633248632148
数值过长,会被强制转换为科学记数法,这个影响后面数据使用,不是我们想要的
那怎么办呢?
这是我们发现pandas的read_excel方法中有一个参数dtype