自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 Flume文件配置及数据迁移

t=N7T8Flume 1.9用户手册中文版 — 可能是目前翻译最完整的版本了https://flume.liyifeng.org/

2023-10-15 10:11:13 124 1

原创 Hadoop虚拟机常用指令与脚本介绍

脚本(Script)是一种描述性语言,依据一定格式可执行化文件。脚本是一种去重复性、多样性、简洁性、规范性、共同性的工具。简单说脚本能够将复杂、重复的工作进行简单化,有序执行的一段固定程序或命令。祝大家国庆快乐。

2023-10-05 11:55:12 549

原创 Python——字符图、樱花树、贪吃蛇

樱花树的绘制效果是通过 Python 中的 turtle 来实现的,Python 的强大之处在于有许多很强大的库,turtle就是其中之一,是 Python 自带的一个库。

2023-10-03 01:38:07 185

原创 Python——Xpath的知识梳理

XPath,全称,即 XML 路径语言,它是一门在 XML 文档中查找信息的语言。最初是用来搜寻 XML 文档的,但同样适用于 HTML 文档的搜索。所以在做爬虫时完全可以使用 XPath 做相应的信息抽取。XPath 的选择功能十分强大,它提供了非常简洁明了的路径选择表达式。另外,它还提供了超过 100 个内建函数,用于字符串、数值、时间的匹配以及节点、序列的处理等,几乎所有想要定位的节点都可以用 XPath 来选择。

2023-10-02 14:21:08 110 1

原创 Hadoop集群配置方面有关报错问题

(在配置文件是要仔细,细心。遇到报错不可怕,可怕的是遇到错误不想办法去解决······祝大家学习有成)

2023-09-23 20:32:00 444 1

原创 如何用python来爬取网页数据?

注:这里的"search_text:love"(表示搜索的是关于love的),cat:1003(表示为音乐),如果出现多个参数,每个参数需要用“,”隔开。Linux操作系统:sodo pip install requests。注:第一个print是打印网址,而第二个print是打印状态,当状态为200时则表示请成功。代理IP:使用代理IP可以使我们不会因为爬取次数过多而遭到封禁(代理IP获取地址已放到最后)https://www.zdaye.com/dayProxy.html(个人推荐)

2023-09-16 14:26:53 920 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除