需求与操作流程
今天领导给了一个表格文件,需要导入数仓,然后和数仓的表进行join。我先把表格放入项目目录所在的本地地址,然后打开pycharm就能看到这个文件了,把这个文件上传到远程解释器。
然后打开xshell,新建数仓临时表,登录hive,将本地文件加载进hive的临时表。
一切和之前的操作一摸一样。但是,查询新建的临时表的时候,数据全是null,只有零星几个数字的数据有。
原因
其实是我建表的时候字段的类型设置错了,应该设置成string(因为我期待的类型是字符串的类型),但是我之前一直设置的都是bigint,汉字加载进数仓的时候发现没办法转化成bigint,因此那个地方就变成null了