自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 2021-06-04

这里写自定义目录标题Hadoop大数据基础单选多选判断问答Hadoop环境设置单选多选判断填空问答HDFS单选多选判断填空问答YARN单选多选判断问答MapReduce单选多选判断填空问答HBase单选判断填空问答Hive单选判断填空Pig单选判断填空问答Flume单选判断填空问答Sqoop单选判断Zookeeper单选多选判断填空问答Ambari单选填空问答Mahout判断问答Hadoop大数据基础单选Hadoop作者是( )A. Martin FowlerB. Kent BeckC.

2021-06-04 21:44:01 13431 1

原创 数据处理以及Hive数据分析

Hive数据处理及其可视化一、pandas进行数据预处理【1】待处理的一部分数据【2】原始数据文件的格式说明【3】数据预处理要求【4】 处理完成的数据字段说明【5】 实验方法使用pandas进行数据预处理【6】 代码(1)首先读取文件:(2) 删除指定字段:(3)加入id字段:(4)修改时间字段:(5)添加省份字段:(6)导出文件一、pandas进行数据预处理【1】待处理的一部分数据// 以下为待处理数据的一部分,仅供参考user_id item_id behavior_type us

2020-08-30 22:45:10 8196 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除