自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

TRHX'S BLOG

个人博客:www.itrhx.com丨Python 网络爬虫丨数据挖掘丨数据分析丨Golang 、前端爱好者丨求知若饥,虚心若愚,只谈技术,莫问前程!注重细节,用心写好文

  • 博客(22)
  • 资源 (11)
  • 论坛 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 使用 hexo-git-backup 插件备份你的 Hexo 博客

欢迎关注我的专栏:《个人博客搭建:Hexo+Github Pages》,从搭建到美化一条龙,帮你解决 Hexo 常见问题!我的博客地址:https://www.itrhx.com/由于 Hexo 博客是静态托管的,所有的原始数据都保存在本地,如果哪一天电脑坏了,或者是误删了本地数据,那就是叫天天不应叫地地不灵了,此时定时备份就显得比较重要了,常见的备份方法有:打包数据保存到U盘、云盘或者其...

2019-09-29 18:00:03 3912

原创 Python3 爬虫实战 — 豆瓣电影TOP250【requests、Xpath、正则表达式、CSV、二进制数据储存】

爬取时间:2019-09-27爬取难度:★★☆☆☆☆请求链接:豆瓣电影 Top 250 以及每部电影详情页爬取目标:爬取榜单上每一部电影详情页的数据,保存为 CSV 文件;下载所有电影海报到本地涉及知识:请求库 requests、解析库 lxml、Xpath 语法、正则表达式、CSV 和二进制数据储存、列表操作

2019-09-28 14:04:07 6727 8

原创 Python3 爬虫实战 — 猫眼电影TOP100【requests、lxml、Xpath、CSV 】

爬取时间:2019-09-23爬取难度:★☆☆☆☆请求链接:https://maoyan.com/board/4爬取目标:猫眼电影 TOP100 的电影名称、电影封面图、主演、上映时间、评分涉及知识:请求库 requests、解析库 lxml、Xpath 语法...

2019-09-24 19:28:49 858

原创 Python3 爬虫学习笔记 C18【爬虫框架 pyspider — 深入理解】

Python3 爬虫学习笔记第十八章 —— 【爬虫框架 pyspider — 深入理解】文章目录【18.1】启动参数【18.1】启动参数常用启动命令:pyspider all,完整命令结构为:pyspider [OPTIONS] COMMAND [ARGS],OPTIONS 为可选参数,包含以下参数:-c, --config FILENAME:指定配置文件名称–logging...

2019-09-21 23:59:47 400

原创 Python3 爬虫学习笔记 C17【爬虫框架 pyspider — 基本使用】

title: Python3 爬虫学习笔记 C17tags:爬虫pyspidercategories:Python3 学习笔记Python3 爬虫thumbnail: https://cdn.jsdelivr.net/gh/TRHX/ImageHosting/ITRHX-PIC/thumbnail/spider.pngavatar: https://cdn.jsdelivr.n...

2019-09-18 13:00:49 527

原创 Hexo 博客提交百度、谷歌搜索引擎收录

文章目录● 写在前面(必看)● 查看网站是否被收录● 百度资源平台添加网站● 提交网站链接● 主动推送● 自动推送● sitemap● 手动提交● 写在前面(必看)网站在没有提交搜索引擎收录之前,直接搜索你网站的内容是搜不到的,只有提交搜索引擎之后,搜索引擎才能收录你的站点,通过爬虫抓取你网站的东西,对于 hexo 博客来说,如果你是部署在 GitHub Pages,那么你是无法被百度收录...

2019-09-17 15:45:29 19597 14

原创 Coding Pages 申请 SSL 证书错误:urn:acme:error:unauthorized: Invalid response from http://xxxxx/

Coding Pages 申请 SSL/TLS 安全证书出现以下错误:urn:acme:error:unauthorized: Invalid response from http://www.xxxx.cn/.well-known/acme-challenge/ysOz9wW3U_GFPP8kRP4w8uknBZ9UfiUT7t2xpu9pDCw [185.199.111.153]: "\...

2019-09-16 16:15:22 10291 2

原创 Hexo 双线部署到 Coding Pages 和 GitHub Pages 并实现全站 HTTPS

部署到 Coding Pages 的好处:国内访问速度更快,可以提交百度收录(GitHub 禁止了百度的爬取)部署到 Coding Pages 的坏处:就今年来说,Coding 不太稳定,随时有宕机的可能,群里的朋友已经经历过几次了,不过相信以后会越来越稳定的部署过程中常见的问题:无法实现全站 HTTPS,Coding 申请 SSL 证书失败,浏览器可能会提示不是安全链接本文前提:你已经将...

2019-09-16 13:42:27 24083 8

原创 pyspider all 启动失败:ValueError: Invalid configuration

执行 pyspider all 启动命令报错如下:C:\Users\Lenovo>pyspider alle:\python\lib\site-packages\pyspider\libs\utils.py:196: FutureWarning: timeout is not supported on your platform. warnings.warn("timeout is...

2019-09-15 16:41:06 708 2

原创 pip sintall pyspider 报错:ERROR: Command errored out with exit status 10

系统环境:Windows 10 64位Python 3.6.5pyspider 是国人写的一款开源爬虫框架,作者博客:http://blog.binux.me/ ,使用 pip install pyspider 命令即可安装 pyspider,安装报错如下:C:\Users\Lenovo>pip install pyspiderCollecting pyspider Do...

2019-09-15 16:05:29 7057 5

原创 Python3 爬虫学习笔记 C16【数据储存系列 — Redis】

Python3 爬虫学习笔记第十六章 —— 【数据储存系列 — Redis】文章目录【16.1】关于 Redis【16.2】使用 Redis【16.3】Key(键)操作【16.4】String(字符串)操作【16.5】Hash(哈希表)操作【16.6】List(列表)操作【16.7】Set(集合)操作【16.8】SortedSet(有序集合)操作【16.9】RedisDump【16.9....

2019-09-14 00:49:51 480

原创 执行 redis-dump 报错:Error connecting to Redis on localhost:6379 (Redis::TimeoutError)

拿本地的 Redis 做测试,运行在 6379 端口上,使用 redis-dump -u localhost:6379 命令用于数据的导出,执行该命令时报错如下:C:\Users\Lenovo>redis-dump -u localhost:6379Error connecting to Redis on localhost:6379 (Redis::TimeoutError)解决...

2019-09-13 23:14:07 8388 2

原创 执行 redis-dump 报错:ERROR (Errno::ENOENT): No such file or directory - ps -o rss= -p xxxxx

redis-dump 命令用于 Redis 数据的导出,执行该命令时报错如下:C:\Users\Lenovo>redis-dump -u 127.0.0.1:6379ERROR (Errno::ENOENT): No such file or directory - ps -o rss= -p 8856解决方法:找到 Ruby 安装目录下的 dump.rb 文件,用记事本或者 V...

2019-09-13 23:04:40 7381 1

原创 Python3 爬虫学习笔记 C15【代理的基本使用】

Python3 爬虫学习笔记第十五章 —— 【代理的基本使用】文章目录【15.1】代理初识【15.2】urllib 库使用代理【15.3】requests 库使用代理【15.4】Selenium 使用代理【15.4.1】Chrome【15.4.1】PhantomJS【15.1】代理初识大多数网站都有反爬虫机制,如果一段时间内同一个 IP 发送的请求过多,服务器就会拒绝访问,直接禁封...

2019-09-10 19:44:24 372

原创 Python3 爬虫学习笔记 C14【验证码对抗系列 — 点触验证码】

Python3 爬虫学习笔记第十四章 —— 【验证码对抗系列 — 点触验证码】文章目录【14.1】关于点触验证码【14.2】点触验证码攻克思路【14.3】模拟登录 12306 — 总体思路【14.4】主函数【14.5】初始化函数【14.6】破解入口函数【14.7】账号密码输入函数【14.8】页面截图函数【14.9】验证码元素查找函数【14.10】获取验证码坐标函数【14.11】验证码剪裁...

2019-09-08 01:36:05 596

原创 Python3 爬虫学习笔记 C13【验证码对抗系列 — 滑动验证码】

Python3 爬虫学习笔记第十三章 —— 【验证码对抗系列—滑动验证码】文章目录【13.1】关于滑动验证码【13.2】滑动验证码攻克思路【13.3】模拟登录 bilibili — 总体思路【13.4】主函数【13.5】初始化函数【13.6】登录函数【13.7】验证码元素查找函数【13.8】元素可见性设置函数【13.9】验证码截图函数【13.10】滑动函数【13.11】计算滑块移动距离函...

2019-09-07 03:49:39 601

原创 Python3 爬虫学习笔记 C12【验证码对抗系列 — 图形验证码】

Python3 爬虫学习笔记第十二章 —— 【攻克验证码系列—普通图形验证码】文章目录【12.1】关于普通图形验证码【12.2】tesserocr 库识别验证码【12.3】pytesseract 库识别验证码【12.4】验证码处理【12.1】关于普通图形验证码普通图形验证码一般由四位纯数字、纯字母或者字母数字组合构成,是最常见的验证码,也是最简单的验证码,利用 tesserocr ...

2019-09-05 22:53:54 428

原创 Python3 爬虫学习笔记 C11【数据储存系列 — MongoDB】

Python3 爬虫学习笔记第十一章 —— 【MongoDB数据储存】文章目录【11.1】关于 MongoDB【11.2】MongoDB 基本操作语句【11.3】连接 MongoDB【11.4】指定数据库【11.5】指定集合【11.6】插入数据【11.6】数据查询【11.7】数据计数【11.8】数据排序【11.9】数据偏移【11.10】更新数据【11.11】删除数据【11.1】关于 ...

2019-09-04 21:59:40 361

原创 Python3 爬虫学习笔记 C10【数据储存系列 — MySQL】

Python3 爬虫学习笔记第十章 —— 【MySQL数据储存】文章目录【10.1】MySQL 基本操作语句数据库操作表操作表的结构表的数据【10.2】Python 连接 MySQL【10.3】创建表【10.4】插入数据【10.5】更新数据【10.6】删除数据【10.7】查询数据【10.8】实战训练 — 爬取CSDN博客标题和地址保存到 MySQL【10.1】MySQL 基本操作语句...

2019-09-03 23:37:04 444 1

原创 完美解决 bash: hexo: command not found

背景介绍:有好几天没动过 Hexo 博客了,今天准备更新的时候输入 hexo s,报错 bash: hexo: command not found,这是啥情况?以前都好好的,想了一下,大概是这几天折腾各种 Python 库的原因,也有可能是更新了啥东西出错了,实在是找不出其他原因了解决思路:本着能解决问题就不重装的原则,首先检查 nodejs 和 npm 是否正常,依次输入命令 node -...

2019-09-02 23:01:06 8806 2

原创 Python3 使用 pymysql 连接 MySQL 建表时出现 Warning3719 UTF8 警告

在学习 Python3 爬虫关系型数据库储存时,利用 pymysql 连接 MySQL 建表,测试用的代码如下,第一句 SQL 用于获取当前 MySQL 的版本信息,第二句 SQL 执行创建 spiders 数据库的操作,如果程序代码正确,将会输出 MySQL 的版本信息,并且能查询到 spiders 数据库的存在import pymysqldb = pymysql.connect(host...

2019-09-02 20:16:19 7442

原创 GitHub 学生认证,申请 GitHub 学生包

GitHub 面对学生推出了学生认证服务,通过认证后就可以得到学生包,学生包大概有十几项优惠,包括 DATADOG Pro 帐户、免费两年的10台服务器,Icons8 3个月的带图标,照片,插图和音乐订阅服务、JETBRAINS 专业桌面 IDE 免费订阅、name.com 一个免费域名和免费高级安全(SSL,隐私保护等)、SendGrid 每月15k的免费电子邮件、.tech 域名免费使用一年...

2019-09-02 16:21:46 944

404错误页面HTML模板.zip

压缩包包含 17 套 404 错误页面 HTML 模板,带有完整 css、js、html 文件。炫酷风、个性风、简洁风、清新风、可爱风......

2020-05-20

后台管理登录页面HTML模板.zip

本压缩包包含 34 套后台管理登录页面 HTML 模板,包含完整 css、js、html 文件,炫酷、简洁、高端、大气模板。登录注册页面、APP 登录 form 表单、手机 wap 登录页、后台数据统计表 bootstrap 后台模板、Admin 后台管理系统模板......

2020-05-20

Ascgen2图片转字符画汉化版

Ascgen2图片转字符画生成器是一款能将图片转换为字符画的工具,使用方便,支持图片拖拽操作,将想要转换的图片拖拽到程序页面即可自动生成对应的字符画。支持手动调整ASCII码密度水平,图片亮度、对比度和抖动程度;支持自定义字母及数字,支持选取图片一部分来生成字符画;支持批量生成字符画,支持黑白或彩色输出;支持纯文本、图片、html等文件输出。

2019-02-01

全球旗帜矢量图.zip

资源为 ZIP 格式,解压即用,内含 212 个国家地区旗帜矢量图,均为 SVG 格式,适合网页设计、UI设计等人员使用!

2020-03-25

个人博客HTML模板(一).zip

本压缩包包含约 320 套个人博客 HTML 模板,包含完整 css、js、html 文件,每个模板均有一张预览图;炫酷、简洁、高端、大气模板,程序员、设计师、开发者风格。 PS:一共有约 650 套模板,由于资源大小限制分成了两份压缩包,个人博客HTML模板(一):https://download.csdn.net/download/qq_36759224/12441214 个人博客HTML模板(二):https://download.csdn.net/download/qq_36759224/12441221

2020-05-20

个人博客HTML模板(二).zip

本压缩包包含约 320 套个人博客 HTML 模板,包含完整 css、js、html 文件,每个模板均有一张预览图;炫酷、简洁、高端、大气模板,程序员、设计师、开发者风格。 PS:一共有约 650 套模板,由于资源大小限制分成了两份压缩包,个人博客HTML模板(一):https://download.csdn.net/download/qq_36759224/12441214 个人博客HTML模板(二):https://download.csdn.net/download/qq_36759224/12441221

2020-05-20

Top50_Matplotlib_Visualizations.py

Python Matplotlib 最常用最有价值的 50 个图表源文件,参照博文介绍使用:https://itrhx.blog.csdn.net/article/details/106615435

2020-06-09

电商行业HTML模板.zip

本压缩包包含约 260 套电商行业网站 HTML 模板,包含完整 css、js、html 文件,炫酷、宽屏、简洁、高端、大气、时尚模板。APP开发者项目主页网站、B2C商城购物网站、女性时尚服装网购平台、IT类电子商务商城购物企业、车展汽车展示网站、手机电子商务网站、电话销售公司网站、服装电商网上商城、IT数码商城网站、金银首饰珠宝店等行业前端 HTML 模板。

2020-06-02

房地产网站HTML模板.rar

本压缩包包含约 61 套房地产行业网站 HTML 模板,包含完整 css、js、html 文件,每个模板均有一张预览图;炫酷、宽屏、简洁、高端、大气模板。灯饰照明公司、别墅装修设计公司、财富地产公司、房产经纪公司、农场别墅中介公司、租赁房地产企业等行业前端 HTML 模板。

2020-06-02

餐饮美食网站HTML模板.rar

本压缩包包含约 170 套餐饮美食行业网站 HTML 模板,包含完整 css、js、html 文件,每个模板均有一张预览图;炫酷、宽屏、简洁、高端、大气模板。咖啡店、外卖、餐馆、茶叶、西餐、中餐等行业前端 HTML 模板。

2020-05-20

APP企业官网HTML模板.rar

压缩包包含 225 套APP/软件企业官网 HTML 模板,前端网页模板,包含完整 css、js、html 文件,每个模板均有一张预览图;单页、多页、高端大气、简洁时尚、响应式模板。

2020-05-20

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除