![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
问题解决
文章平均质量分 59
TurboBoost
这个作者很懒,什么都没留下…
展开
-
hive处理实际数据时数据总量的问题
1.背景在下在研究hive时,手上的数据是excel数据转化为txt以后再改为UTF-8编码最后上传的。txt文件有若干个,将它们统一编号使用rz命令上传到linux虚拟机上,放在同一个新建的文件夹下。首先是创建表,然后将所有txt文件中的数据导入表中LOAD DATA LOCAL INPATH '/root/test/*.txt' INTO TABLE turbo;这时候就可以对表进行操作了,首先原创 2016-07-29 17:33:14 · 2346 阅读 · 1 评论 -
数据标准化 使用Python脚本处理excel单元格换行符
在下在做数据分析时,原始数据是excel格式的,导入hive表时将其转化为txt格式。 excel文件转txt格式的步骤如下: 1.打开另存为 2.选择txt格式保存 3.打开转成的txt将编码修改为UTF-8在往hive表中导入数据时常常以换行符‘\n’来分割条数据。然而有时因为数据格式不够标准,即excel单元格中存在着换行符情况。例子如下:在这个表格中,B3,B4单元格都存在这换行符。原创 2016-08-17 09:37:19 · 22174 阅读 · 3 评论 -
日常一些小问题与解决方案总结
1 解决Sublime Text 3在GBK编码下的中文乱码问题_百度经验 http://jingyan.baidu.com/article/fc07f98972ee0a12fee51943.html2 字符突然改变大小和边距 是因为全角和半角符号的关系,如图修改为半角符号问题得以解决原创 2016-07-25 16:14:25 · 491 阅读 · 0 评论