自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 收藏
  • 关注

原创 基于海量微博数据的仓库构建与舆情热点挖掘项目笔记(第三天)

基于海量微博数据的仓库构建与舆情热点挖掘项目第三天数据校验方法说明与实战案例数据出现错位原因及解决办法数据清洗分词UDF编写 数据校验 方法说明与实战案例 抽样检查:查看最复杂的那一列及其后面的字段 // 数据校验方法 select 字段 from 表 limit 条数; 数据出现错位原因及解决办法 原因:数据向左对齐 解决办法:将数据导入法方式与数据表的解析方式保持完全一致 // 数据解析格式 row format serde 'org.apache.hadoop.hive.serde2.OpenCS

2020-07-22 21:32:38 240

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除