自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (3)
  • 收藏
  • 关注

原创 python文字识别easyORC的运用

EasyOCR是一个用python编写的OCR三方库。可以在python中调用,用来识别图像中的文字,并输出为文本目录1.下载2.使用1.下载1.首先建议先加载easyorc的依赖库torchnumpyscipyPillowPyYAMLtorchvision>=0.5opencv-pythonscikit-imagepython-bidi加快加载的清华镜像pip install xxx库 -i https://pypi.tuna.tsinghua.

2021-12-15 16:49:47 5964 3

转载 python爬虫简单js逆向(破译js)

python爬虫简单js逆向(破译js)内容简介 一、找到包含所需数据的ajax数据包 二、通过浏览器工具进行关键字定位 三、分析相关js文件,找出具体实现方式 1、getApiKey()函数 2、encryptApiKey()函数 3、encryptTime()函数 4、comb()函数 5、查找不一致的原因...

2021-11-23 16:58:18 10940 13

原创 python+selenium某投诉平台词云展现

本人最近想了解下关于双十一投诉的问题,就搜索了下投诉平台,发现某投诉平台是比较合适的(消费者投诉平台,24小时有效投诉1万5千条)。 搜索关键词后,发现网站的翻页是下拉加载的方式。每下拉到底一次就加载下一页。 深思熟虑,采取一种简单的方式,使用selenium不断的(看想采集数据的多少决定次数,鄙人是1500次)下拉滚动条到底,然后再获取当前页面的html。for i in range(1500): js = "var q=document...

2021-11-23 13:17:30 1323 15

转载 Python 爬虫进阶必备 | 关于投诉平台网页参数 signature 加密逻辑分析

Python 爬虫进阶必备 | 关于投诉平台网页参数 signature 加密逻辑分析(转载)今日网站aHR0cHM6Ly90b3VzdS5zaW5hLmNvbS5jbi9jb21wYW55L3ZpZXcvP2NvdWlkPTYzODQ5MTI0MzE=很久没有写原创了,其实我私底下囤了不少原创的文章,不过都不是爬虫相关的。。。关于今天这个网站的分析流程还是老三样,直接开搞。抓包与加密定位这个网站的下拉翻页是 ajax 加载的,所以可以直接在 xhr 翻页里面找到这个请求打.

2021-11-23 11:54:01 813

世界顶尖管理咨询公司(麦肯锡)工作方法,思考很重要

世界顶尖管理咨询公司(麦肯锡)工作思考方法。既然选择了远方 便只顾风雨兼程,人生第一快乐是做到自己认为自己做不到的事,人生第二快乐是做到别人认为自己做不到的事。

2019-01-04

(基础)EXCEL数据处理基础案例详细流程讲解

(基础)EXCEL数据处理基础案例详细流程讲解,(基础)EXCEL数据处理基础案例详细流程讲解,(基础)EXCEL数据处理基础案例详细流程讲解

2019-01-04

(基础)EXCEL常用表格设计案例详细流程讲解

(基础)EXCEL常用表格设计案例详细流程讲解,

2019-01-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除