afyzju-CSDN博客

原创山东大学创新项目实训个人工作日志（二十三）

景点图片爬取（改进）经过测试发现，之前爬到的数据并不是

2021-06-06 17:09:57 766

原创山东大学创新项目实训个人工作日志（二十二）

在爬取过程中遇到的反爬机制以及解决

2021-06-05 01:50:49 111

原创山东大学创新项目实训个人工作日志（十五）

景点详细信息和美食数据的爬取以及存储

2021-05-28 20:37:23 104

原创山东大学创新项目实训个人工作日志（七）

基本完成了对去哪儿网的门票信息的爬取。在

2021-04-22 11:39:52 71

完成了在携程网站爬取指定城市的特色美食的功能。具体方式是输入用户所选择的城市，然后就可以返回一系列的特色美食的信息。首先是爬取携程的所有城市的ID，并把它保存在一个列表中，用户指定城市后就可以直接从中取出，然后访问到指定城市的页面。获取城市ID： def getCityList(self): html = self.getHtml('https://piao.ctrip.com/ticket/?districtid=1') soup = BS(html, "ht

2021-04-20 23:43:47 109

原创山东大学创新项目实训个人工作日志（五）

完成了对途牛景点门票的爬取。主要实现的功能就是输入用户的关键词和用户所在的城市（或者选择的城市），就可以搜索出相应的景点所对应的门票的信息来。通过观察可以发现，途牛和大众点评有个相同点，就是它们对每个城市都有一个独立的网站，而我们只要获取了那个网址，就可以实现定位，但是城市一般都是缩写，而且没有什么规律，所以我采用的办法是从主页选择城市的页面的源代码中提取出所有的城市href，然后保存在一个字典数据结构中，这样下次再想用的时候直接查询即可。同时加入了模糊查询功能，因为城市有的带“市”字，而有的不带，所以

2021-04-19 22:46:00 74

afyzju的博客

原创山东大学创新项目实训个人工作日志（二十三）

原创山东大学创新项目实训个人工作日志（二十二）

原创山东大学创新项目实训个人工作日志（二十一）

原创山东大学创新项目实训个人工作日志（二十）

原创山东大学创新项目实训个人工作日志（十九）

原创山东大学创新项目实训个人工作日志（十八）

原创山东大学创新项目实训个人工作日志（十七）

原创山东大学创新项目实训个人工作日志（十六）

原创山东大学创新项目实训个人工作日志（十五）

原创山东大学创新项目实训个人工作日志（十四）

原创山东大学创新项目实训个人工作日志（十三）

原创山东大学创新项目实训个人工作日志（十二）

原创山东大学创新项目实训个人工作日志（十一）

原创山东大学创新项目实训个人工作日志（十）

原创山东大学创新项目实训个人工作日志（九）

原创山东大学创新项目实训个人工作日志（八）

原创山东大学创新项目实训个人工作日志（七）

原创山东大学创新项目实训个人工作日志（六）

原创山东大学创新项目实训个人工作日志（五）

原创山东大学创新项目实训个人工作日志（四）

原创山东大学创新项目实训个人工作日志（三）

原创山东大学创新项目实训个人工作日志（二）

原创山东大学创新项目实训个人工作日志（一）

空空如也

空空如也