你不知道你不知道的事

我虽新手,就在学习

零基础认识BeautifulSoup简单爬虫

BeautifulSoup实现简单爬取BeautifulSoup是一个智能的处理工具,用户只要将抓取到的网页源码交给它,然后告诉它:我要img标签,而且只要宽度为180的img标签。它就会直接把符合的标签拿给你,当说:我只要里面的文字,它也会会很智能地把文字提取出来。 1.爬取tripadv...

2017-12-02 21:49:55

阅读数:686

评论数:3

从零基础认识爬虫-简单爬取tripadvisor网站

爬取tripadvisor网站从简单的爬取入门,目标是为了拿到tripadvisor网站的相关信息。网站的样子如下图: 爬取的目标是:每一页的标题、标签、图片地址(爬取失败) 1.页面爬取源码首先分析元素的爬取方式from bs4 import BeautifulSoup import requ...

2017-11-26 02:02:00

阅读数:597

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭