人生苦短,我用Python
前面写了一个爬取小说的,想想用Python爬小说好像low了点(不够高大上啊(逼格不够啊)),今天给大家整个高端点的,我们来爬一下凤凰网的首页新闻,这下逼格应该够了。
爬取网页嘛,大家都知道request,beautifsoup,今天我们整点不一样的,今天使用的是pyquery,这也是一个第三方库,需要使用pip install 来安装的,安装方法想必大家都知道的,我这里就不赘述了,至于使用方法,可以看一下这个pyquery,我们就直接开始操作了。
打开凤凰网我们按F12,先观察一下,
第一步点击这个箭头我们就可以在左边网页也就是数字2箭头指向的文章标题,点击之后我们就可以看到右边就出现了对应的href和标题,继续观察我们发现标题和链接都在类news_list-1dYUdgWQ下面