自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 电影评分分析-大数据项目

[实验数据]本实验所用数据为美国在线影片提供商NetFlix从1998年10月到2005年12月的电影评分数据,包含了480,189用户对17,770多部影片的100,480,507条评分。该数据包含了2个数据集。影片评分数据集已经存放在HDFS上,路径为“/data/13/5/rating/rating.csv”,各字段以制表符分隔。数据集还存放在了Hive上,表名为“bigdata_...

2019-05-20 10:09:17 7434 2

原创 用户上网行为分析-大数据项目

[实验数据]本实验所用数据为某宽带运营商从2014年11月11日0时到1时的用户上网点击流数据,包含了31,487,488条记录。数据集已经存放在HDFS上,路径为“/data/13/4/dpi/dpi.csv”,各字段以制表符分隔。数据集还存放在了Hive上,表名为“bigdata_cases.dpi”。各字段的定义为:字段 定义srcip 用户所在客户端IPad 用户上网设备号ts...

2019-05-20 10:08:35 6941 1

原创 微博消息分析-大数据项目

[实验数据]本实验所用数据为新浪微博数据,包含了从2013年6月1日到14日期间的12,102,744条微博。数据集已经存放在HDFS上,路径为“/data/13/3/post/post.csv”,各字段以制表符分隔。数据集还存放在了Hive上,表名为“bigdata_cases.post”。各字段的定义为:字段 定义PostId 微博标识符UserId 用户标识符UtcTime 微博...

2019-05-20 10:07:20 2401

原创 超市零售数据分析-大数据项目

[实验数据]本实验所用数据为国内某超市从2012年8月1日到2013年8月1日共一年的交易数据,包含了812,847条交易、2,893,385件单个商品以及20,154名顾客。该数据包含了3个数据集。交易概况数据集已经存放在HDFS上,路径为“/data/13/2/sales_head/sales_head.csv”,各字段以制表符分隔。数据集还存放在了Hive上,表名为“bigdata...

2019-05-20 10:06:37 7919 6

原创 车辆GPS位置信息分析-大数据项目

[实验数据]本实验所用数据为江苏省南京市出租车从2010年9月1日到2日的GPS位置数据,包含了7,726辆出租车的共33,042,225条位置记录。数据集已经存放在HDFS上,路径为“/data/13/1/gps/gps.csv”,各字段以制表符分隔。数据集还存放在了Hive上,表名为“bigdata_cases.gps”。各字段的定义为:字段 定义VehicleId 出租车标识符Ti...

2019-05-20 10:04:29 6678 3

原创 CentOS修改vim的配色

rpm -qa |grep vim 看看系统中是否安装了下面 3 个 rpm 包,如果有就是安装了 vim 。vim-enhanced-XXXXX-XXX如果只有一个就下载这个包 —>yum install vim-enhanced3.下在配色方案 http://www.easycolor.cc/vim/list.html解压找到如 molokai.vim 文件,将放在...

2019-05-10 19:38:41 1216

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除