![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
网络爬虫
AppleYRY
求其上者得其中,求其中者得其下。
展开
-
正则表达式:
什么是正则表达式:正则表达式就是数据筛选的表达式;原子:原子是正则表达式中最基本的组成单位,每个正则表达式中至少包含一个原子。常见的原子类型有:a,普通字符作为原子b,非打印字符作为原子(\t,\n)c,通用字符作为原子d,原子表\w:匹配字母,数字,下划线;\d:匹配任意的十进制数;\s:匹配空白的字符;\W:匹配\w相反的对象,即除了字母,数字下划线之外的任意的字符;\...原创 2019-11-26 11:12:57 · 165 阅读 · 0 评论 -
网络爬虫:
网络爬虫是什么?定义:自动地从互联网中定向或者不定向的采集信息的一种程序;分类:通常分为通用网络爬虫;聚焦网络爬虫;等等。网络爬虫能做什么?**通用网络爬虫**可以用在***搜索引擎***中;**聚焦网络爬虫**可以从互联网中***自动采集信息并代替我们筛选出相关的数据***出来。1,搜索引擎2,采集金融数据3,采集商品数据4,自动过滤广告5,采集竞争对手客户数据6,采集...原创 2019-11-21 10:43:40 · 141 阅读 · 0 评论 -
如何查看模块及如何安装模块:
如何快速了解一个新模块的功能,主要方法有:1,help()–输入对应的模块名;2,阅读该模块的文档,一般大型的模块都有;3,查看该模块的源代码,分析各方法的作用,也可以从名字上进行分析;安装模块时,解决超时,自动断掉的问题:1,使用VPN(推荐);2,多试几次;3 ,使用本地whl文件夹来安装(推荐):http://www.lfd.uci.edu/~gohlke/pythonlibs...原创 2019-11-20 10:32:57 · 212 阅读 · 0 评论 -
python异常处理
TypeError: a bytes-like object is required, not ‘HTTPResponse’如何处理?源代码···pythondata = urlopen(“http://www.baidu.com”)fh1 = open(“file1.txt”,“wb”)fh1.write(data)fh1.close()修改后:data = urlopen(“...原创 2019-11-18 17:20:07 · 470 阅读 · 0 评论