python中Beautifulsoup
文章平均质量分 78
guang_mang
故事的开头总是这样,适逢其会,猝不及防。故事的结局总是这样,花开两朵,天各一方
展开
-
关于python爬取笔趣阁网站上面完美世界小说
1这个是用BS爬下来的,其实是不难的,理解了就好,点击这里恩这本小说很不错的2看下这个就是用正则表达式来提取的章节链接,不过这个是要前面加上前缀3打开之后,我使用BS处理的,因为这个处理这个内容中间的Br比较方便,如果还是用正则表达式,就是有点麻烦# coding:utf-8import urllibimport refrom bs4 import Beautiful原创 2016-12-18 20:27:39 · 3597 阅读 · 0 评论 -
python关于用BeautifulSoup爬取网易动态评论
1关于python爬取网易json格式的动态评论,因为这个使用json格式来编写的,所以就是要先是要找到这个json格式的文件的链接,先是在用F12出现这个页面2网易跟帖上这个网站就是这个hotlist,最热跟帖,和newslist最新跟贴,现在我们是要爬这个最热跟帖3然后就是要打开这个链接,然后机会出现下面这个页面。4然后就可以利用这个ison的特性来取出来自己想要的原创 2016-12-19 19:28:04 · 2623 阅读 · 0 评论 -
python中用Beautifulsoup提取集搜客网站的信息
1爬取集搜客网站上面的信息点击打开链接2看下这个源代码3使用正则表达式提取出来# coding:utf8import urllib2import timefrom bs4 import BeautifulSoupclass YZW():#先是定义一个模块然后就是用来包含用到的函数 def __init__(self): self.user_agent='Mo原创 2016-12-19 19:40:48 · 465 阅读 · 1 评论