![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
Febe_Tien
这个作者很懒,什么都没留下…
展开
-
开始我的博客之旅
用记录的方式来标记我的学习历程,好记性不如烂笔头,一步一个脚印向前走,逐渐清醒,看见天明...![看见天明](https://img-blog.csdn.net/20180727152428648?watermark/2/text/aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0ZlYmVfVGllbg==/font/5a6L5L2T/fontsize/400/fill/I0JBQk...原创 2018-07-27 15:25:52 · 126 阅读 · 0 评论 -
xpath string()标签下所有文本
<dd class="info"> <a href="//sdsgjx.b2b.hc360.com/shop/show.html"> 主营产品:小型 <font>挖掘机</font> 履带 <font>挖掘机</font>原创 2018-08-15 14:45:26 · 4021 阅读 · 0 评论 -
python简单验证码识别
本文是使用PIL+pytesseract识别简单验证码,目的是要识别红色字体,思路如下:下载源验证码图片,来源http://www.bhi.com.cn/Public/Isvalid.ashx 去除非红色干扰像素 将图片转换为灰度图,二值化,去除孤立噪点 通过pytesseract识别出结果话不多说,直接上代码#! -*- encoding:utf-8 -*-"""...原创 2018-08-15 16:17:50 · 951 阅读 · 0 评论