山东大学创新项目实训个人工作日志(五)

完成了对途牛景点门票的爬取。

主要实现的功能就是输入用户的关键词和用户所在的城市(或者选择的城市),就可以搜索出相应的景点所对应的门票的信息来。

通过观察可以发现,途牛和大众点评有个相同点,就是它们对每个城市都有一个独立的网站,而我们只要获取了那个网址,就可以实现定位,但是城市一般都是缩写,而且没有什么规律,所以我采用的办法是从主页选择城市的页面的源代码中提取出所有的城市href,然后保存在一个字典数据结构中,这样下次再想用的时候直接查询即可。同时加入了模糊查询功能,因为城市有的带“市”字,而有的不带,所以选取的是最符合城市名称的那一个,返回URL。

然后根据关键词进行搜索,在搜索出的页面用BeautifulSoup提取出关键信息即可。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值