[python爬虫学习]1.爬取本地网页
python基础语法,自动跳过,虽然看得也是很幸苦。
大体思路就是通过CSS样式的位置来定位到自己想要的信息。
首先介绍BeautifulSoup,这是一款神器,有了它,就可以解析一切网页(至少就我认知水准而言)。而它,则是把一个html解析成一个树状结构(打开网页源代码就能看到一条条层级分明的代码),,每个节点都是Python对象,所有对象可以归纳为4种: Tag , NavigableStr
原创
2017-09-27 05:01:47 ·
858 阅读 ·
0 评论