今天写程序,遇到一个很有意思的情况
我的原始日志里,如果是下面这样的格式,第一行带字符开头。那么pandas read_csv读进来后,第一列的数据类型是object。
=>10000 E AUTO_JOB_CONTROL OK
91000 E INIT_BATCH OK
13000 P INIT_PRCSTS OK
12800 P INIT_FILCFG OK
如果改成下面这样的话,读进来就是int64
10000 E AUTO_JOB_CONTROL OK
91000 E INIT_BATCH OK
13000 P INIT_PRCSTS OK
12800 P INIT_FILCFG OK
如果meger的时候,object和int64这两个列为主键的话,就会报错了。
查询了下资料,原因如下。
原因:
因为字符串长度是不固定的,pandas没有用字节字符串的