项目1环境使用说明

最新推荐文章于 2024-08-24 23:53:15 发布

qq_52376922

最新推荐文章于 2024-08-24 23:53:15 发布

阅读量60

点赞数

文章标签： bash 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52376922/article/details/131260986

版权

一、准备

1.cd BigData/tools

2.ls 查看脚本文件有哪些

3、bash create-cluster.sh 之后 bash start-bd.sh 创建集群并启动大数据服务

若集群已成功创建，则只需通过bash start-cluster.sh和bash start-bd.sh启动集群和大数据服务。若出现容器已存在而无法启动的问题，docker ps -a查看所有容器，然后使用docker rm master(等)删除容器。

4、vi create-cluster.sh 可以查看文件内容；可通过cat /etc/hosts查看当前集群的配置

5、之后打开四个Tab并依次进入master/slave1/slave2等：docker exec -it （--privileged可省略） master (有空格) /bin/bash 等

6、jps 查看当前进程节点数

7、vi tmp 、vi tmp.txt 进入文件后退出：p!

8、ls 查看master下的目录，进入cd /root/之后再ls查看

9、cd quotes ：进入这个爬虫文件里

10、爬虫scrapy常用指令：

scrapy startproject<project_name>[protect_dir]：创建新的爬虫项目

scrapy runspider <spider_file.py>：运行爬虫文件

scrapy fetch<URL>：获取指定的URL，显示获取过程

scrapy view <URL>：在浏览器中打开URL显示网址内容

scrapy crawl <spider>：运行爬虫项目

scrapy list :列出当前目录下的所有爬虫文件

11、scrapy crawl quotes

二、进入mysql；master>service mysql start

1、mysql -u root -p

2、show databases; /创建名为quotes的数据库：create database quotes;

3、use quotes;

4、show tables;

三、

1、在BigData文件下，scp start-cluster.sh root@<master的ip地址>:/tmp：复制到@后的地方

2、在maste：/tmp下 hadoop fs -ls /mr

hadoop fs -rm -r /mr/output

hadoop fs -cat /mr/input/*

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
项目1环境使用说明

5、之后打开四个Tab并依次进入master/slave1/slave2等：docker exec -it （--privileged可省略） master (有空格) /bin/bash 等。1、在BigData文件下，scp start-cluster.sh root@<master的ip地址>:/tmp：复制到@后的地方。8、ls 查看master下的目录，进入cd /root/之后再ls查看。二、进入mysql；7、vi tmp 、vi tmp.txt 进入文件后退出：p!
复制链接

扫一扫

qq_52376922 CSDN认证博客专家 CSDN认证企业博客

码龄4年

10: 原创

131万+: 周排名

136万+: 总排名

1385: 访问

: 等级

100: 积分

13: 粉丝

0: 获赞

8: 评论

2: 收藏

私信

关注

热门文章

最新评论

文件的打包与压缩--大数据服务器系统搭建与应用
CSDN-Ada助手: 非常感谢您的分享，这篇博客对于大数据服务器系统的搭建和应用有着非常有价值的指导意义。恭喜您写出了这样一篇优秀的博客，并且希望您可以继续保持创作的热情和动力。下一步，建议您可以探讨一下大数据服务器系统在实际应用中的效果和优化方法，相信这一定会对读者们有所帮助。再次感谢您的分享！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
Linux文件搜索
CSDN-Ada助手: 恭喜您又写了一篇优秀的博客！Linux文件搜索确实是一个非常实用的技能，您的文章对于初学者来说应该非常有帮助。接下来，我建议您可以深入探讨一些更高级的Linux技巧，比如shell脚本编写或者网络配置等等，以便让读者更全面地了解这个操作系统。期待您的下一篇作品！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
Linux文本文件
CSDN-Ada助手: 恭喜您写了第5篇博客，非常有耐心和毅力呢！看您对Linux文本文件的研究颇有心得，下一步可以尝试探讨一些更深入的话题，比如Linux命令行的使用技巧或者Shell脚本编写等等。期待您的下一篇作品。如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Linux文件目录权限管理
CSDN-Ada助手: 恭喜您写出了这篇关于Linux文件目录权限管理的博客，内容非常实用！建议您在以后的博客中可以探讨一下Linux系统的网络管理或者安全管理，这样可以让读者更全面地了解Linux系统。期待您的下一篇博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply6 看奖励名单。
Logstash
CSDN-Ada助手: 恭喜您写了第7篇博客，对于Logstash的介绍十分详细，让我对它有了更深入的了解。建议您可以在后续的创作中探讨一下Logstash的应用场景，以及如何优化它的使用效果。期待您的下一篇博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。