![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
网页数据
mawenqi0729
软件工程专业,嵌入式方向,大三
展开
-
新浪体育——篮球足球的直播和战报爬取
新浪体育——篮球足球的直播和战报爬取用到的包的介绍以上是基于python3.6.5的新浪体育直播间篮球足球的直播和战报爬取所引用到的全部内外部包,下面将会挑几个与爬虫息息相关的包进行介绍。1.lxmlPython 标准库中自带了 xml 模块,但是性能不够好,而且缺乏一些人性化的 API,相比之下,第三方库 lxml 是用 Cython 实现的,而且增加了很多实用的功能...原创 2018-06-14 15:25:28 · 14423 阅读 · 1 评论 -
入门python爬虫
入门Python爬虫为了爬新浪体育直播间往年的直播和战报自学了Python爬虫,学习期间碰到了很多奇奇怪怪的网页报错,所以总结了一篇常用的http状态码(参见我另一篇博客),根据这个状态码可以轻松发现是网页打开过程中的那一块出了问题,现在把整个入门Python爬虫的过程总结如下:概述1.什么是爬虫爬虫,即网络爬虫,大家可以理解为在网络上爬行的一直蜘蛛,互联网就比作一张大...原创 2018-06-14 22:31:27 · 420 阅读 · 0 评论