最近做数据处理的时候经常用到oracle,遇到挺多问题,其中一个就是如题,刷完数据也不报错,但是数据库就是没数据,排查半天,简直被坑惨。总结可以从下面几个方面排查问题:
1. 字段大小是否合适
在数据库建表的时候,经常需要用到 varchar2 类型,因为 varchar2 类型的每个字符都是占两个字节,所以如果定义的时候是 varchar2(100),那么就表示只能存储不超过50个字符的记录。to_sql在执行的时候对这种问题是不报错的,所以如果刚好你的数据里面有了一条大于定义范围的数据,一般就会存储数据失败。
2. 字段名和表名定义大小写问题
oracle字段名和表名虽然是大小写不敏感的,但是执行完建表语句后,一般都会转为大写。在查询的时候,经常会遇到 xx标识符无效字段的错误,所以建议在定义表名和字段名的时候,最好统一为大写,尤其建议避免大小写混用的写法(就是驼峰命名)。如果执行to_sql的时候报错某个字段无效,此时不仅仅要看这个字段是否有问题,还要看表名写法是否有问题,oracle和python中最好统一为大写或者小写。
3. 超长记录的存储
因为 varchar2的最大存储是4000,所以超过这个长度的记录就要用clob存储了,但是clob的效率会比较慢,所以实际使用中请综合考虑。
4. 类型定义问题
在执行to_sql的时候,有些同学会忽略 dtype 这个参数,官方文档是非常建议指定这个参数的,尤其是对于一些整型字段的空值处理,而且指定这个参数后效率会更高。
5. UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 0-11: ordinal not in range(128)
在使用to_sql操作的时候可能会遇到上面的错误信息,即使已经在程序和数据库engine中指定了utf-8编码格式。出现上面错误是因为编码没有生效,设置下面环境变量即可:
os.environ['NLS_LANG'] = 'AMERICAN_AMERICA.AL32UTF8'