自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

TRHX'S BLOG

个人博客:www.itrhx.com丨Python 网络爬虫丨数据挖掘丨数据分析丨Golang 、前端爱好者丨求知若饥,虚心若愚,只谈技术,莫问前程!注重细节,用心写好文

  • 博客(16)
  • 资源 (11)
  • 论坛 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 Python3 爬虫学习笔记 C09【数据储存系列 — 文件储存】

文章目录【9.1】TXT 文本存储【9.1.1】基本示例【9.1.2】打开方式【9.2】JSON 文件存储【9.2.1】对象和数组【9.2.2】读取 JSON【9.2.3】写入 JSON 文件【9.3】CSV 文本存储【9.3.1】写入【9.3.2】读取Python3 爬虫学习笔记第七章 —— 【文件储存】用解析器解析出数据之后,还需要对数据进行保存。保存的形式多种多样,最简单的形式是...

2019-08-27 18:49:43 405

原创 Python3 爬虫学习笔记 C08【解析库 Beautiful Soup】

文章目录【7.1】关于 Beautiful Soup【7.2】Beautiful Soup 的基本使用【7.3】节点选择器【7.3.1】元素选择【7.3.2】提取信息【7.3.3】嵌套选择【7.3.4】关联选择【7.4】方法选择器【7.4.1】find_all() 方法【7.4.2】find() 方法【7.1】关于 Beautiful SoupBeautiful Soup 可以从 HTML...

2019-08-26 21:12:54 500

原创 Python3 爬虫学习笔记 C07 【解析库 lxml】

文章目录【7.1】关于 lxml【7.2】使用 XPath【7.3】查找所有节点【7.4】查找子节点【7.5】查找父节点【7.6】属性匹配【7.7】文本获取【7.8】属性获取【7.9】一个属性包含多个值的匹配【7.10】多个属性匹配一个节点【7.11】按顺序选择节点【7.12】节点轴选择【7.1】关于 lxmllxml 是 Python 的一个解析库,支持 HTML 和 XML 的解析,...

2019-08-25 19:27:40 505

原创 Python3 爬虫学习笔记 C06 【正则表达式】

文章目录【6.1】关于正则表达式【6.2】re.match() 方法【6.2.1】提取内容【6.2.2】通用匹配【6.2.3】贪婪匹配【6.2.4】非贪婪匹配【6.2.5】转义匹配【6.2.6】修饰符【6.3】re.search() 方法【6.4】re.findall() 方法【6.5】re.sub() 方法【6.5】re.compile() 方法【6.1】关于正则表达式正则表达式是对字符...

2019-08-24 18:32:25 590

原创 Python3 爬虫学习笔记 C05 【Selenium + 无界面浏览器】

文章目录关于无界面浏览器PhantomJSHeadless ChromeHeadless Firefox关于无界面浏览器无界面(headless)浏览器,会把网站加载到内存并执行页面上的 JavaScript,因为不会展示图形界面,所以运行起来比完整的浏览器更高效。Selenium 搭配无界面浏览器使用,被称为爬虫利器,常用的无界面浏览器有:PhantomJS、Headless Chrom...

2019-08-23 20:08:36 439

原创 Python3 已经安装相关库,Pycharm 仍然报错 ModuleNotFoundError: No module named 'xxxxxx' 的解决办法

以 requests 库为例,打开 cmd,运行命令 pip install requests,即可安装 requests 库,由于我已经安装过,所以会提示 Requirement already satisfied此时,我们使用 Pycharm 运行以下代码:import requestsurl = 'https://www.baidu.com/s'data = { 'ie'...

2019-08-22 23:43:40 17242 7

原创 Windows/Android/iOS 等常见 User-Agent 大全

User Agent 中文名为用户代理,简称 UA,是一个特殊字符串头,使得服务器能够识别客户使用的操作系统及版本、CPU 类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等。Python 爬虫通过伪装 UA 可以绕过某些检测。以下为搜集的常见的各浏览器的 User-Agent,其中:安卓操作系统:Android 7.1.1;OPPO R9sk Build/NMF26FPC操作...

2019-08-22 22:29:51 6083 2

原创 Selenium 显式等待条件及其含义

等待条件含义title_is标题是某内容title_contains标题包含某内容presence_of_element_located节点加载出,传入定位元组,如 (By.ID, ‘p’)visibility_of_element_located节点可见,传入定位元组visibility_of可见,传入节点对象presence_of_...

2019-08-22 17:51:20 437

原创 Python3 爬虫学习笔记 C04 【自动化测试工具 Selenium】

文章目录 【3.1】下载驱动 【3.2】声明浏览器对象 【3.3】访问页面 【3.4】启动参数 【3.5】查找节点 【3.5.1】查找单个节点 【3.5.2】查找多个节点 【3.6】节点交互 【3.7】动作链 【3.8】执行 JavaScript 【3.9】禁用加载 【3.10】获取节点信息 【3.10.1】获取属性 【3.10.2】获取文本值 【3.10.3】获取 ID、位置、标签名、大小 【...

2019-08-22 16:59:46 493

原创 Python3 爬虫学习笔记 C03 【Ajax 数据爬取】

文章目录 【3.1】Ajax 简介 【3.2】解析真实地址提取 【3.1】Ajax 简介Ajax — Asynchronous Javascript And XML(异步 JavaScript 和 XML),是指一种创建交互式网页应用的网页开发技术。可以在不重新加载整个网页的情况下,对网页的某部分进行更新。 【3.2】解析真实地址提取以豆瓣电影动作片排行榜为例,地址为:https://...

2019-08-20 22:45:38 556

原创 Python3 爬虫学习笔记 C02 【基本库 requests 的使用】

文章目录 2.1 requests 简介 2.2 requests 基本用法 2.3 requests 构建 GET 请求 2.3.1 基本用法 2.3.2 二进制数据抓取 2.3.3 添加 headers 2.4 requests 构建 POST 请求 2.5 requests 高级用法 2.5.1 上传文件 2.5.2 使用 Cookies 2.5.3 会话维持 2.5.4 SSL 证书验证...

2019-08-19 18:28:58 513

原创 Python3 爬虫学习笔记 C01 【基本库 urllib 的使用】

文章目录 1.1 urllib 简介 1.1.1 urllib.request 发送请求1.1.1.1 urllib.request.urlopen()● 基本使用方法● 添加参数● data 参数● timeout 参数1.1.1.2 urllib.request.Request()1.1.1.3 urllib.request.urlretrieve() 1.1.2 urllib.error ...

2019-08-19 01:00:25 650

原创 利用官方支持为基于GitHub Pages的Hexo博客启用HTTPS

HTTP(超文本传输协议),是一个基于请求与响应,无状态的,应用层的协议,常基于TCP/IP协议传输数据,互联网上应用最为广泛的一种网络协议,所有的WWW文件都必须遵守这个标准。设计HTTP的初衷是为了提供一种发布和接收HTML页面的方法。HTTPS(超文本传输安全协议),是以安全为目标的HTTP通道,简单讲是HTTP的安全版。即HTTP下加入SSL层,HTTPS的安全基础是SSL,因此...

2019-08-11 21:39:26 19656

原创 光学字符识别 Tesseract-OCR 的下载、安装和基本用法

OCR:即Optical Character Recognition,光学字符识别,是指检查纸或者图片上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;Tesseract-OCR:一款由HP实验室(惠普布里斯托实验室)开发,由Google维护的开源OCR引擎,可以经过不断的训练,增强图像转换文本的能力,Tesseract-OCR 也经常被用于Py...

2019-08-11 01:27:17 868

原创 Github+jsDelivr+PicGo 打造稳定快速、高效免费图床

– 前言图床是个啥东西就不用过多介绍了,先来对比一下各路图床:微博图床:以前用的人比较多,从2019年4月开始开启了防盗链,凉凉SM.MS:运营四年多了,也变得越来越慢了,到了晚上直接打不开图片,速度堪忧其他小众图床:随时有挂掉的风险Imgur等国外图床:国内访问速度太慢,随时有被墙的风险大厂储存服务:例如七牛云、又拍云、腾讯云COS、阿里云OSS等,操作繁琐,又是实名认证又是域...

2019-08-01 14:44:09 26263 37

原创 利用Cloudflare为基于GitHub Pages的Hexo博客添加HTTPS支持

文章目录-- 前言-- 注册 Cloudflare-- 添加站点--修改DNS--开启 HTTPS--重定向强制 HTTPS– 前言GitHub Pages 自带的域名(xxx.github.io)支持开启 https 服务,可以在仓库的【Settings】- 【GitHub Pages】下勾选【Enforce HTTPS】即可,但是如果你设置了自定义域名的话,这种方法就不管用了,因为 he...

2019-08-01 14:33:52 1476

404错误页面HTML模板.zip

压缩包包含 17 套 404 错误页面 HTML 模板,带有完整 css、js、html 文件。炫酷风、个性风、简洁风、清新风、可爱风......

2020-05-20

后台管理登录页面HTML模板.zip

本压缩包包含 34 套后台管理登录页面 HTML 模板,包含完整 css、js、html 文件,炫酷、简洁、高端、大气模板。登录注册页面、APP 登录 form 表单、手机 wap 登录页、后台数据统计表 bootstrap 后台模板、Admin 后台管理系统模板......

2020-05-20

Ascgen2图片转字符画汉化版

Ascgen2图片转字符画生成器是一款能将图片转换为字符画的工具,使用方便,支持图片拖拽操作,将想要转换的图片拖拽到程序页面即可自动生成对应的字符画。支持手动调整ASCII码密度水平,图片亮度、对比度和抖动程度;支持自定义字母及数字,支持选取图片一部分来生成字符画;支持批量生成字符画,支持黑白或彩色输出;支持纯文本、图片、html等文件输出。

2019-02-01

全球旗帜矢量图.zip

资源为 ZIP 格式,解压即用,内含 212 个国家地区旗帜矢量图,均为 SVG 格式,适合网页设计、UI设计等人员使用!

2020-03-25

个人博客HTML模板(一).zip

本压缩包包含约 320 套个人博客 HTML 模板,包含完整 css、js、html 文件,每个模板均有一张预览图;炫酷、简洁、高端、大气模板,程序员、设计师、开发者风格。 PS:一共有约 650 套模板,由于资源大小限制分成了两份压缩包,个人博客HTML模板(一):https://download.csdn.net/download/qq_36759224/12441214 个人博客HTML模板(二):https://download.csdn.net/download/qq_36759224/12441221

2020-05-20

个人博客HTML模板(二).zip

本压缩包包含约 320 套个人博客 HTML 模板,包含完整 css、js、html 文件,每个模板均有一张预览图;炫酷、简洁、高端、大气模板,程序员、设计师、开发者风格。 PS:一共有约 650 套模板,由于资源大小限制分成了两份压缩包,个人博客HTML模板(一):https://download.csdn.net/download/qq_36759224/12441214 个人博客HTML模板(二):https://download.csdn.net/download/qq_36759224/12441221

2020-05-20

Top50_Matplotlib_Visualizations.py

Python Matplotlib 最常用最有价值的 50 个图表源文件,参照博文介绍使用:https://itrhx.blog.csdn.net/article/details/106615435

2020-06-09

电商行业HTML模板.zip

本压缩包包含约 260 套电商行业网站 HTML 模板,包含完整 css、js、html 文件,炫酷、宽屏、简洁、高端、大气、时尚模板。APP开发者项目主页网站、B2C商城购物网站、女性时尚服装网购平台、IT类电子商务商城购物企业、车展汽车展示网站、手机电子商务网站、电话销售公司网站、服装电商网上商城、IT数码商城网站、金银首饰珠宝店等行业前端 HTML 模板。

2020-06-02

房地产网站HTML模板.rar

本压缩包包含约 61 套房地产行业网站 HTML 模板,包含完整 css、js、html 文件,每个模板均有一张预览图;炫酷、宽屏、简洁、高端、大气模板。灯饰照明公司、别墅装修设计公司、财富地产公司、房产经纪公司、农场别墅中介公司、租赁房地产企业等行业前端 HTML 模板。

2020-06-02

餐饮美食网站HTML模板.rar

本压缩包包含约 170 套餐饮美食行业网站 HTML 模板,包含完整 css、js、html 文件,每个模板均有一张预览图;炫酷、宽屏、简洁、高端、大气模板。咖啡店、外卖、餐馆、茶叶、西餐、中餐等行业前端 HTML 模板。

2020-05-20

APP企业官网HTML模板.rar

压缩包包含 225 套APP/软件企业官网 HTML 模板,前端网页模板,包含完整 css、js、html 文件,每个模板均有一张预览图;单页、多页、高端大气、简洁时尚、响应式模板。

2020-05-20

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除