![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
一江溪水
这个作者很懒,什么都没留下…
展开
-
用正则表达式提取信息
正则表达式,说白了就是用来匹配字符的,正则表达式是用来简洁表达一组字符串的表达式. 正则表通常被用来检索、替换那些符合某个模式(规则)的文本。 很多编程语言都支持正则表达式进行字符串操作。在代码中常简写为regex、regexp或RE。 比如Pythonz中就有一个叫:re 的正则表达式库,这是Python的标准库,安装Python后自带,使用时只需要import re我们可以通过r原创 2017-09-14 20:23:15 · 11164 阅读 · 0 评论 -
用Python写网络爬虫
网络爬虫(又被称为网页蜘蛛,网络机器人,是一种按照一定 的规则,自动地抓取万维网信息的程序或者脚本。前言在讲爬虫之前,我们需要知道我们是如何从网络上获取信息的,有人说,百度啊,谷歌啊!!!!! 没错,大多时候,我们都是利用他们从网络上面获取我们的信息的,其实搜索引擎也是爬虫的一种,他们的爬每天都有成千上万的爬虫在互联网上不断的爬去各种各样的信息,存到他们的数据库,做出索引,通过复杂的算原创 2017-09-10 20:31:06 · 1277 阅读 · 0 评论