python笔记
IY的数据学习笔记
这个作者很懒,什么都没留下…
展开
-
网页抓取三种方式
正则表达式范例Import re Import requests url=‘http://example.webscraping.com/view/United-Kingdom239’ html=requests.get(url).content re.findall(’<td class=”w2pfw”>(.*?)</td>’,html)[1]Beautifulsoup范例Import reque原创 2017-04-19 15:30:39 · 873 阅读 · 0 评论 -
调用其他文件py文件的函数
from 文件名 import 函数名 注意:文件需要在同一目录下原创 2017-04-19 14:19:58 · 466 阅读 · 0 评论 -
Beautifulsoup爬虫步骤
Beautifulsoup爬虫步骤需要的库: requests bs4 Beautifulsoup大概思路:使用requests模块向网站发送请求,提取返回内容,并且转化为标准HTML文档,使用Beautifulsoup的函数提取网页元素。 结合文档TAG,就能快捷的提取网页元素。 >from bs4 import BeautifulSoup >brken_html=’<ulclass=co原创 2017-04-18 15:47:48 · 558 阅读 · 0 评论