![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Nosql
内容涵盖Hive和HBase,Zookeeper,Hadoop,Sqoop和Flume
李夏晗很好
这个作者很懒,什么都没留下…
展开
-
大数据组件下载
大数据组件下载命令:wget https://********************************所有大数据组件地址:https://archive.apache.org/dist/原创 2022-04-25 16:44:22 · 1728 阅读 · 0 评论 -
如何在hdfs中进行增删查,hadoop中常用命令
hadoop常见指令: hdfs dfs -copyFromLocal /local/data /hdfs/data:将本地文件上传到 hdfs上(原路径只能是一个文件) hdfs dfs -put /tmp/ /hdfs/ :和 copyFromLocal 区别是,put 原路径可以是文件夹等 hadoop fs -ls / :查看根目录文件 hadoop fs -ls /tmp/data:查看/tmp/data目录 hadoop fs -cat /tmp/a.tx转载 2021-11-17 00:15:31 · 346 阅读 · 0 评论 -
ubuntu中修改用户密码&修改mysql密码链接
复制了别人的虚拟机,里面有用户名不是自己的想修改步骤如下:1.进入到root用户下去对其他用户信息进行修改:su root2、gedit /etc/sudoers 修改所有原有用户名3、gedit /etc/passwd ,找到代表你的那一行,修改用户名为新的用户名。 注意:只修改用户名!4、gedit /etc/shadow,找到代表你的那一行,修改用户名为新用户名 。5、gedit /etc/group,你应该发现你的用户名在很多个组中,全部修改!6、 sudo mv /home/oldus原创 2021-11-14 17:48:15 · 1123 阅读 · 0 评论 -
如何在xshell上进行复制粘贴
平时文档中代码太长,容易敲错的,复制粘贴会很好的让我们避免这些错误那具体步骤如下:1.点击工具,选择里面的按键对应复制:ctrl+shlft+c粘贴:ctrl+shlft+v按照上面的步骤来就可以了。...原创 2021-11-14 16:58:35 · 7656 阅读 · 0 评论 -
xshell连不上虚拟机的几种情况。还有ping不通网络的情况。
第一种情况:虚拟网络编辑器中第三位(209)和 自己虚拟机中的第三位(209)保持一致,不显示自己ip的可以执行命令:sudo / sbin/dhclient再查看ip:ip a再不显示ip就往下看:1.先查看自己虚拟网络编辑器中的第三位是什么(我这上面的是209),先记住这个数字。2.修改虚拟机中的静态ip命令:sudo vi /etc/netplan/文件(注意这个文件名可能不一样,可以先到/etc/netplan目录下看一下有没有这个文件)文件中需要有这些内容,没有的补全。(注意这原创 2021-11-14 16:43:16 · 5400 阅读 · 1 评论 -
大数据中的各个组件
数据产生是数据平台的源头,没有数据就没有大数据平台(数据产生传输处理)数据的产生:一.数据产生的来源分为以下几种:1.业务系统:来自企业IT系统存储在数据库的数据eg:POS销售系统、EPR系统、CRM系统2.Web系统:日志文件eg:访问了哪些网页、点击了哪些按钮、停留了多长时间3.手机App:传感器eg:指纹识别、人脸识别、位置、WIFI4.外部系统:爬虫数据或外部购买eg:舆情数据二.数据按照结构分为以下几种:1.结构化数据:格式非常规范,比较容易处理eg:数据库2.半结构原创 2021-11-11 17:57:16 · 4020 阅读 · 0 评论 -
Hive面试基本须知
Hive面试基本Hive的优缺点:优点:1)操作接口采用类SQL语法,提供快速开发的能力(简单、容易上手)。2)避免了去写MapReduce,减少开发人员的学习成本。3)Hive的执行延迟比较高,因此Hive常用于数据分析,对实时性要求不高的场合。4)Hive优势在于处理大数据,对于处理小数据没有优势,因为Hive的执行延迟比较高。5)Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数。缺点:1.Hive的HQL表达能力有限(1)迭代式算法无法表达(2)数据挖掘方面不擅原创 2021-08-06 14:27:03 · 147 阅读 · 0 评论