![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
Mr丶冷文
这个作者很懒,什么都没留下…
展开
-
爬虫学习(一)
爬虫概念是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,简单来说就是一个网络机器人,是一个程序爬虫执行流程1.提交url给网站服务器,服务器会响应一个信息给客户端2.解析网页(提取我们需要的有用信息)3.保存信息,保存到文本文档,mysql数据库,EXCEL爬虫分类1.通用网络爬虫: 由种子url扩展到整个web策略:深度优先,广度优先2.聚焦网络爬虫:爬取...原创 2019-07-25 13:32:41 · 272 阅读 · 0 评论 -
爬虫学习(二)
前言上篇文章我们使用了原生urllib3库进行爬虫,但我们对爬取到的网页还需解码,很不方便,我们这次就使用另一个叫做requests的库正文使用requests库的方式如果没有requests可以通过在虚拟环境中执行pip install requests安装编写程序# @File: code02.py# @Author: lengwen# @Time: 20...原创 2019-07-25 13:33:42 · 166 阅读 · 0 评论 -
爬虫学习(三)
前言上篇文章我们使用了原生正则表达式来解析网页,这次我们使用xpath来解析网页正文安装xpathpip install lxml开始xpath使用Xpath需要从lxml库中导入etree模块,还需使用HTML类对需要匹配的HTML对象进行初始化。HTML类的基本语法格式如下。lxml.etree.HTML(text, parser=None, *, base_ur...原创 2019-07-25 13:34:16 · 635 阅读 · 0 评论 -
Mac下matplotlib中文显示
下载字体文件:simhei.zip 密码:7xdj找到matplotlib的安装位置import matplotlibprint (matplotlib.matplotlib_fname()) # 将会获得matplotlib包所在文件夹得到如下结果看下配置之前使用中文的输出打开matplotlib包文件夹将下载的字体复制到font/ttf下找到 #...原创 2019-07-26 10:21:39 · 373 阅读 · 0 评论