自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

波波菜鸟

波波菜鸟 CSDN认证博客专家 CSDN认证企业博客

码龄6年

10: 原创

17万+: 周排名

227万+: 总排名

4万+: 访问

: 等级

499: 积分

40: 粉丝

50: 获赞

44: 评论

257: 收藏

私信

关注

热门文章

分类专栏

面试题整理 5篇
大数据 7篇

最新评论

使用Sqoop将Hive导入Mysql中特殊字符问题
tree0tree: 我也遇到过类似问题，分享一下处理思路和经验吧。评论里没法插入图片，所以我只能文字描述了。根据sqoop日志，排查出报错异常的关键字是Love Song，可以写sql或者直接把报错的hive底层text文件下载下来，然后vim查看，搜索关键字。然后可以看出这个报错行有个蓝标的^@Love song,而且这个字符是不可见的。继续验证。写sql: [code=sql] select split(resource_text,' '), split(substring(resource_text, 2, 5000), ' ') from tb where ascii(resource_text)=0 [/code] 查出的结果类似于这样：["\u0000Love Song"]，所以处理方案是：处理方案是： if(ascii(resource_text)=0, substr(resource_text,2,5000), resource_text) as resource_text, 如此之后，sqoop程序正常通过
hive中进行增量统计-full join的用法-如何合并表中两列
_Habit: 那要照你这么说的话,那60,70不是20了吗
【社招】快手_数据仓库_面试题整理
波波菜鸟: 一万组，每组13万数据左右。
【社招】快手_数据仓库_面试题整理
weixin_38043310: 先根据身份证号码前四位预分组，将13亿数据分成10万一组。这里应该是将13亿数据分成10万组吧
【社招】快手_数据仓库_面试题整理
烈叶: [code=sql] mysql select t0.wid wid,t0.uid uid1,t1.uid uid2 ,count(t0.uid) from test t0 join test t1 where t0.wid=t1.wid and t0.uid>t1.uid and ( abs(t0.ontime-t1.ontime)<600 or abs(t0.offtime-t1.offtime)<600 ) group by t0.wid, t0.uid ,t1.uid HAVING count(t0.uid) >2 hive select t0.wid as wid,t0.uid as uid1,t1.uid as uid2,count(t0.uid) as c from w_info as t0 join w_info as t1 where t0.wid=t1.wid and t0.uid>t1.uid and ( abs(unix_timestamp(t0.ontime,'yyyy/MM/dd HH:mm:ss')-unix_timestamp(t1.ontime,'yyyy/MM/dd HH:mm:ss'))<600 or abs(unix_timestamp(t0.offtime,'yyyy/MM/dd HH:mm:ss')-unix_timestamp(t1.offtime,'yyyy/MM/dd HH:mm:ss'))<600 ) group by t0.wid ,t0.uid,t1.uid having count(t0.uid) >2; [/code]

最新文章

大数据

关注

文章平均质量分 89

关注数：文章数：7 文章阅读量：37974 文章收藏量：220

作者: 波波菜鸟

这个作者很懒，什么都没留下…

展开