使用正则表达式爬取豆瓣top250的数据,毕竟之前是用xpath来爬取的,我目前的爬取了网址,但是有些是商用的网页,像淘宝京东,机票啊都很难爬。
感觉越学越没劲,都爬不到想要的数据,现在只能是一边学习web开发,一边学习爬虫。
一些案例不懂得可以回过头去顺遍看看基础,先不写这个,之后我再更新。
使用正则表达式爬取豆瓣top250的数据,毕竟之前是用xpath来爬取的,我目前的爬取了网址,但是有些是商用的网页,像淘宝京东,机票啊都很难爬。
感觉越学越没劲,都爬不到想要的数据,现在只能是一边学习web开发,一边学习爬虫。
一些案例不懂得可以回过头去顺遍看看基础,先不写这个,之后我再更新。