![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
网络爬虫
bug as bugs
这个作者很懒,什么都没留下…
展开
-
爬取最新版51job/前程无忧
通过网页代码分析,我们需要的内容藏在在js代码块中的json中,然后找到藏着的网页链接进去通过json在线解析器查看,我们需要的内容确实是json格式下面就直接上代码import jsonimport urllib.request,urllib.error #制定URL,获取网页数据import redef main(): url="https://search.51job.com/list/090200,000000,0000,00,9,99,Python,2,1.html原创 2020-08-20 23:38:27 · 1551 阅读 · 4 评论 -
用python.xpath爬取猫眼电影
网页分析,我们需要的内容都在dd标签里面直接上码import requests #爬虫基本模块from parsel import Selector #从网页中提取数据import csv# 得到指定一个url的网页内容def getOnepage(url): headers={ "User-Agent": "Mozilla / 5.0(Windows NT 10.0;WOW64) AppleWebKit / 537.36(KHTML, like Gecko)原创 2020-08-20 14:01:20 · 634 阅读 · 0 评论 -
代码下方出现灰色虚线的解决办法
原因:拼写检查,对于不太符合要求的命名规则等进行提醒,只要能正常运行,可以先不去关注它解决办法:代码下方有灰色的虚线点开右下角的头像把那个小方块拉倒最左边就可以了灰色虚线没有了...原创 2020-07-31 19:04:48 · 1043 阅读 · 0 评论 -
python爬取豆瓣电影250保存在EXCEL中详细代码及其详细注释
原创 2020-07-31 18:54:18 · 267 阅读 · 0 评论 -
python代码报错提示信息IndexError: list index out of range以及修改
python报错的提示信息,出现这种错误怎么解决报错的代码21行:报错的代码76行:报错的代码141行:原创 2020-07-29 22:35:22 · 631 阅读 · 0 评论