python 数据采集
Deep,dark,fantasy
我想一直走在数据分析的路上
展开
-
python—网络数据采集------初见网络爬虫
一、一个最简单的爬虫from urllib.request import urlopenhtml = urlopen("http://baidu.com/pages/page1.html")print(html.read())执行这段代码后,将会输出http://baidu.com/pages/page1.html这个网页的全部HTML代码,urlopen用来打开并读取一个从网络获取的远...原创 2019-01-16 19:24:58 · 179 阅读 · 0 评论 -
python——网络数据采集--复杂HTML解析
一、使用BeautifulSoup和网页标签抓取内容1.打开网页:http://www.pythonscraping.com/pages/warandpeace.html2.按F12查看网页结构3.可以看到有这样两个标签:<span class="green"></span>原创 2019-01-31 12:01:35 · 287 阅读 · 0 评论