自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 SQOOP的安装

链接:https://pan.baidu.com/s/1uSpVlCU1Y0iWe7if24i1tg。

2024-02-06 16:39:23 207 1

原创 xshell5无法连接虚拟机

2、关闭NetworkManager,并取消开机自启。正常包含ens33,虚拟机无法连接缺少ens33。1、重新编辑网络配置文件。

2024-01-15 16:28:34 497 1

原创 安装MySQL5.7,HIVE

如果ping不同:则按照以下步骤操作:最终的解决办法:1.修改网卡vim /etc/sysconfig/network-scripts/ifcfg-ens33删除里面所有的东西,粘贴下面的文本进去: TYPE=Ethernet BOOTPROTO=static HWADDR=00:0C:29:B1:0D:FF NAME=ens33 DEVICE=ens33 ONBOOT=yes IPADDR=192.168.40.133 GATEWAY=192.168.40.

2024-01-14 12:52:12 391 1

原创 安装Zookeeper及Hbase

3.在node1,node2重复以上步骤或者使用分发命令,直接在node1,node2中修改。如果出现一直停止,则需要执行以下命令,分别在master,node1,node2杀死对应进程。4.将master的环境变量分发给node1,node2 ,再执行source命令。2.创建myid文件注意点:在master创建完后需要插入0(

2024-01-13 18:17:08 513 1

原创 hadoop问题解决

的配置文件做了修改,就必须分发(要求是三台虚拟机保持一致)(三台虚拟机都要进去的目录)确保自己写的东西都是对。删除三台该文件下面的。

2024-01-12 14:41:13 383 1

原创 搭建Hadoop运行环境

文件内容见Hadoop集群搭建.pdf。

2024-01-12 14:37:10 335 1

原创 虚拟机准备工作

链接:https://pan.baidu.com/s/1CrKIgrO2rhd6wCAfL9kUkA。

2024-01-12 12:32:46 349

原创 基于大数据框架的弹幕、评论处理

因此,我们可以看出对于小米7手环这款商品,大部分的用户还是认可的,但对于部分用户来说该商品的价格比较贵,需要降低价格以及提升价保方面,部分质量差方面可能是质检方面的问题,需要及时处理用户问题,提高质量检查,功能方面需要新增加城市公交卡功能。第三步,利用hive进行文本的数据处理,通过hive建表,统计展示评论的好坏程度,用来展开该商品相关信息,模拟生产好评论,处理恶意评论和不当言论评论。(3)表是纯文本形式,需要转换成为列表才能进行数据分析,确定分割符号,删除空格值,建立新的表,存储分割的新列表内容。

2024-01-10 15:54:20 457

原创 基于Python的淘宝用户购物数据可视化分析

结果分析可以看出2012年的三级用户为260,2013年的三级用户为284,2014年的三级用户为280,二级用户为4,每年的三级用户在不断增加,甚至在2014年新增加了4个二级用户,这也代表平台往常的运营模式是比较不错,在巩固老用户的基础上,不断吸引新用户的加入,但该模式需要稍做调整以应对更高等级的用户。结果可以看出,用户中pv类型的行为类型购物次数最多,而pv表示页面浏览量,即用户访问某个页面的次数,这代表绝大多数的用户购买是根据该商品的页面浏览量来决定的,即pv可以作为评判用户等级的重要标签。

2024-01-10 14:30:30 3579 1

原创 多元统计分析及R语言建模大作业

在过去的二十年里,中国的经济发展迅速,人民生活水平不断提高,中国大学生入学率发生了显著的变化,教育事业也取得了显著的成就。经济、教育资源较差的地区为海南、青海、西藏、宁夏、陕西、重庆、新疆、天津、吉林、黑龙江、内蒙古、甘肃、山西、辽宁。其次是辽宁、上海、福建、吉林、江苏、海南、内蒙古、黑龙江;主要将数据汇聚成三张表:第一张是各地区本科录取率,第二张是各地区的高中数量等与大学生入学率相关的影响因素,第三张是近二十年的大学生毛入学率、参考人数和经济状况表格,第四张是以每年录取率为y值,其他因素为x值的表格。

2024-01-10 13:47:54 1945 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除