- 博客(5)
- 收藏
- 关注
原创 flume的安装与部署
保存退出执行命令,查看flume版本。1.在flume官网上下载压缩包。切换到conf里修改配置文件。编写配置文件,添加环境变量。修改之前先复制一份哦。添加java环境变量。
2023-10-15 00:10:47
62
1
原创 配置虚拟机的网络(静态)
查看信息使用“ifcfg-ens33”命令编辑内容 配置staic模式网络。输入ip addr 的指令查看这台虚拟机的IP地址看是否修改成功。输入ping 指令查看是否成功连接网络。收到回复后ctrl z 停止就配置成功了。修改成功后“:wq” 保存退出。打开虚拟机切换到该目录。输入指令重启网络配置。
2023-10-05 22:53:19
61
原创 怎样获取标签的文本内容
通过class属性定位查找出html中{li}第三个 {li}标签属性。通过href属性定位查找出html中{li}第四个 {li}标签属性。比如说{li}中第一个{li}标签下的a元素文本信息。查找出html内容中想找的文本信息。删除左右换行符 使用空格替换/n。使用etree解析html内容。提取出所有ul下的文本信息。
2023-10-05 22:10:25
185
原创 怎样去实现百度网页的抓取
进入百度网页F12打开控制台复制请求头以及百度网页地址。在python中写入请求头以及要抓取的百度网页地址。就实现百度网页的抓取其他网页也是一样的方式。抓取后就可以进行其他的操作了。
2023-09-24 13:22:19
226
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人