TRHX'S BLOG

个人博客:www.itrhx.com,好记性不如烂笔头,记录毕生所学!

自定义博客皮肤

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Python3 爬虫学习笔记 C09【数据储存系列 — 文件储存】

文章目录【9.1】TXT 文本存储【9.1.1】基本示例【9.1.2】打开方式【9.2】JSON 文件存储【9.2.1】对象和数组【9.2.2】读取 JSON【9.2.3】写入 JSON 文件【9.3】CSV 文本存储【9.3.1】写入【9.3.2】读取 Python3 爬虫学习笔记第七章 —...

2019-08-27 18:49:43

阅读数 30

评论数 0

Python3 爬虫学习笔记 C08【解析库 Beautiful Soup】

文章目录【7.1】关于 Beautiful Soup【7.2】Beautiful Soup 的基本使用【7.3】节点选择器【7.3.1】元素选择【7.3.2】提取信息【7.3.3】嵌套选择【7.3.4】关联选择【7.4】方法选择器【7.4.1】find_all() 方法【7.4.2】find() ...

2019-08-26 21:12:54

阅读数 43

评论数 0

Python3 爬虫学习笔记 C07 【解析库 lxml】

文章目录【7.1】关于 lxml【7.2】使用 XPath【7.3】查找所有节点【7.4】查找子节点【7.5】查找父节点【7.6】属性匹配【7.7】文本获取【7.8】属性获取【7.9】一个属性包含多个值的匹配【7.10】多个属性匹配一个节点【7.11】按顺序选择节点【7.12】节点轴选择 【7...

2019-08-25 19:27:40

阅读数 38

评论数 0

Python3 爬虫学习笔记 C06 【正则表达式】

文章目录【6.1】关于正则表达式【6.2】re.match() 方法【6.2.1】提取内容【6.2.2】通用匹配【6.2.3】贪婪匹配【6.2.4】非贪婪匹配【6.2.5】转义匹配【6.2.6】修饰符【6.3】re.search() 方法【6.4】re.findall() 方法【6.5】re.su...

2019-08-24 18:32:25

阅读数 23

评论数 0

Python3 爬虫学习笔记 C05 【Selenium + 无界面浏览器】

文章目录关于无界面浏览器PhantomJSHeadless ChromeHeadless Firefox 关于无界面浏览器 无界面(headless)浏览器,会把网站加载到内存并执行页面上的 JavaScript,因为不会展示图形界面,所以运行起来比完整的浏览器更高效。Selenium 搭配无界...

2019-08-23 20:08:36

阅读数 61

评论数 0

Python3 已经安装相关库,Pycharm 仍然报错 ModuleNotFoundError: No module named 'xxxxxx' 的解决办法

以 requests 库为例,打开 cmd,运行命令 pip install requests,即可安装 requests 库,由于我已经安装过,所以会提示 Requirement already satisfied 此时,我们使用 Pycharm 运行以下代码: import requests...

2019-08-22 23:43:40

阅读数 2307

评论数 0

Windows/Android/iOS 等常见 User-Agent 大全

User Agent 中文名为用户代理,简称 UA,是一个特殊字符串头,使得服务器能够识别客户使用的操作系统及版本、CPU 类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等。Python 爬虫通过伪装 UA 可以绕过某些检测。 以下为搜集的常见的各浏览器的 User-Agent,其中:...

2019-08-22 22:29:51

阅读数 18

评论数 0

Selenium 显式等待条件及其含义

等待条件 含义 title_is 标题是某内容 title_contains 标题包含某内容 presence_of_element_located 节点加载出,传入定位元组,如 (By.ID, ‘p’) visibility_of_element_located 节点可见,传...

2019-08-22 17:51:20

阅读数 46

评论数 0

Python3 爬虫学习笔记 C04 【自动化测试工具 Selenium】

文章目录 【3.1】下载驱动 【3.2】声明浏览器对象 【3.3】访问页面 【3.4】启动参数 【3.5】查找节点 【3.5.1】查找单个节点 【3.5.2】查找多个节点 【3.6】节点交互 【3.7】动作链 【3.8】执行 JavaScript 【3.9】禁用加载 【3.10】获取节点信息 【3...

2019-08-22 16:59:46

阅读数 27

评论数 0

Python3 爬虫学习笔记 C03 【Ajax 数据爬取】

文章目录 【3.1】Ajax 简介 【3.2】解析真实地址提取 【3.1】Ajax 简介 Ajax — Asynchronous Javascript And XML(异步 JavaScript 和 XML),是指一种创建交互式网页应用的网页开发技术。可以在不重新加载整个网页的情况下,对网页的...

2019-08-20 22:45:38

阅读数 19

评论数 0

Python3 爬虫学习笔记 C02 【基本库 requests 的使用】

文章目录 2.1 requests 简介 2.2 requests 基本用法 2.3 requests 构建 GET 请求 2.3.1 基本用法 2.3.2 二进制数据抓取 2.3.3 添加 headers 2.4 requests 构建 POST 请求 2.5 requests 高级用法 2.5...

2019-08-19 18:28:58

阅读数 25

评论数 0

Python3 爬虫学习笔记 C01 【基本库 urllib 的使用】

文章目录 1.1 urllib 简介 1.1.1 urllib.request 发送请求1.1.1.1 urllib.request.urlopen()● 基本使用方法● 添加参数● data 参数● timeout 参数1.1.1.2 urllib.request.Request()1.1.1....

2019-08-19 01:00:25

阅读数 32

评论数 0

利用官方支持为基于GitHub Pages的Hexo博客启用HTTPS

HTTP(超文本传输协议),是一个基于请求与响应,无状态的,应用层的协议,常基于TCP/IP协议传输数据,互联网上应用最为广泛的一种网络协议,所有的WWW文件都必须遵守这个标准。设计HTTP的初衷是为了提供一种发布和接收HTML页面的方法。 HTTPS(超文本传输安全协议),是以安全为目标的H...

2019-08-11 21:39:26

阅读数 7546

评论数 0

光学字符识别 Tesseract-OCR 的下载、安装和基本用法

OCR:即Optical Character Recognition,光学字符识别,是指检查纸或者图片上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程; Tesseract-OCR:一款由HP实验室(惠普布里斯托实验室)开发,由Google维护的开源...

2019-08-11 01:27:17

阅读数 165

评论数 0

最新屏蔽 CSDN 广告方法,专注阅读学习!(2019.9.28 CSDN广告全面下线)

写在前面:CSDN广告实在是太多,此文章可教你如何彻底屏蔽CSDN广告,之前也有人写过类似教程,但现在看来已经不太适用了,如果有侵犯CSDN官方权益,可以直接联系我删除,Email:admin@itrhx.com 广告屏蔽实现原理:通过浏览器安装 Adblock Plus 插件的方法来实现广...

2019-08-02 00:56:47

阅读数 5602

评论数 1

Github+jsDelivr+PicGo 打造稳定快速、高效免费图床

– 前言 图床是个啥东西就不用过多介绍了,先来对比一下各路图床: 微博图床:以前用的人比较多,从2019年4月开始开启了防盗链,凉凉 SM.MS:运营四年多了,也变得越来越慢了,到了晚上直接打不开图片,速度堪忧 其他小众图床:随时有挂掉的风险 Imgur等国外图床:国内访问速度太慢,随时有被墙...

2019-08-01 14:44:09

阅读数 3462

评论数 0

利用Cloudflare为基于GitHub Pages的Hexo博客添加HTTPS支持

文章目录-- 前言-- 注册 Cloudflare-- 添加站点--修改DNS--开启 HTTPS--重定向强制 HTTPS – 前言 GitHub Pages 自带的域名(xxx.github.io)支持开启 https 服务,可以在仓库的【Settings】- 【GitHub Pages】下...

2019-08-01 14:33:52

阅读数 381

评论数 0

提示
确定要删除当前文章?
取消 删除