- 博客(6)
- 收藏
- 关注
原创 电影评分分析-大数据项目
[实验数据]本实验所用数据为美国在线影片提供商NetFlix从1998年10月到2005年12月的电影评分数据,包含了480,189用户对17,770多部影片的100,480,507条评分。该数据包含了2个数据集。影片评分数据集已经存放在HDFS上,路径为“/data/13/5/rating/rating.csv”,各字段以制表符分隔。数据集还存放在了Hive上,表名为“bigdata_...
2019-05-20 10:09:17 7434 2
原创 用户上网行为分析-大数据项目
[实验数据]本实验所用数据为某宽带运营商从2014年11月11日0时到1时的用户上网点击流数据,包含了31,487,488条记录。数据集已经存放在HDFS上,路径为“/data/13/4/dpi/dpi.csv”,各字段以制表符分隔。数据集还存放在了Hive上,表名为“bigdata_cases.dpi”。各字段的定义为:字段 定义srcip 用户所在客户端IPad 用户上网设备号ts...
2019-05-20 10:08:35 6941 1
原创 微博消息分析-大数据项目
[实验数据]本实验所用数据为新浪微博数据,包含了从2013年6月1日到14日期间的12,102,744条微博。数据集已经存放在HDFS上,路径为“/data/13/3/post/post.csv”,各字段以制表符分隔。数据集还存放在了Hive上,表名为“bigdata_cases.post”。各字段的定义为:字段 定义PostId 微博标识符UserId 用户标识符UtcTime 微博...
2019-05-20 10:07:20 2401
原创 超市零售数据分析-大数据项目
[实验数据]本实验所用数据为国内某超市从2012年8月1日到2013年8月1日共一年的交易数据,包含了812,847条交易、2,893,385件单个商品以及20,154名顾客。该数据包含了3个数据集。交易概况数据集已经存放在HDFS上,路径为“/data/13/2/sales_head/sales_head.csv”,各字段以制表符分隔。数据集还存放在了Hive上,表名为“bigdata...
2019-05-20 10:06:37 7919 6
原创 车辆GPS位置信息分析-大数据项目
[实验数据]本实验所用数据为江苏省南京市出租车从2010年9月1日到2日的GPS位置数据,包含了7,726辆出租车的共33,042,225条位置记录。数据集已经存放在HDFS上,路径为“/data/13/1/gps/gps.csv”,各字段以制表符分隔。数据集还存放在了Hive上,表名为“bigdata_cases.gps”。各字段的定义为:字段 定义VehicleId 出租车标识符Ti...
2019-05-20 10:04:29 6678 3
原创 CentOS修改vim的配色
rpm -qa |grep vim 看看系统中是否安装了下面 3 个 rpm 包,如果有就是安装了 vim 。vim-enhanced-XXXXX-XXX如果只有一个就下载这个包 —>yum install vim-enhanced3.下在配色方案 http://www.easycolor.cc/vim/list.html解压找到如 molokai.vim 文件,将放在...
2019-05-10 19:38:41 1216
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人