主要在完成的工作是爬虫的实现,爬取的网站是大众点评,主要使用了python的requests和BeautifulSoup库。
通过解析网站源码可以发现,每个城市都拥有一个网站,而这些网站都可以在选择城市的页面找到,所以通过它获取城市列表,然后根据用户的城市进入相应的网页,在团购网站上进行搜索操作,可以检索出优惠信息。
比较麻烦的是详情页面需要登录,这点采用了cookie实现。
大众点评的价格信息以及其他的数字信息都是加密之后的,所以之后几天的工作就是把这一部分解码出来,然后对优惠信息进行汇总。
山东大学创新项目实训个人工作日志(三)
最新推荐文章于 2021-06-04 01:04:07 发布