自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 山东大学创新项目实训个人工作日志(二十三)

景点图片爬取(改进)经过测试发现,之前爬到的数据并不是

2021-06-06 17:09:57 752

原创 山东大学创新项目实训个人工作日志(二十二)

在爬取过程中遇到的反爬机制以及解决

2021-06-05 01:50:49 97

原创 山东大学创新项目实训个人工作日志(二十一)

测试与修改

2021-06-04 12:53:53 80

原创 山东大学创新项目实训个人工作日志(二十)

马蜂窝平台的景点图片爬取

2021-06-04 01:04:07 144

原创 山东大学创新项目实训个人工作日志(十九)

前后端合并

2021-06-03 22:39:46 54

原创 山东大学创新项目实训个人工作日志(十八)

景点门票爬取的速度提升

2021-06-02 23:48:47 88

原创 山东大学创新项目实训个人工作日志(十七)

景点门票数据的整合和组织

2021-06-01 23:24:05 185

原创 山东大学创新项目实训个人工作日志(十六)

景点门票数据的整合

2021-05-30 21:04:41 88

原创 山东大学创新项目实训个人工作日志(十五)

景点详细信息和美食数据的爬取以及存储

2021-05-28 20:37:23 87

原创 山东大学创新项目实训个人工作日志(十四)

klook客路爬虫的实现

2021-05-26 20:36:58 2258

原创 山东大学创新项目实训个人工作日志(十三)

同程旅游爬虫

2021-05-23 16:39:16 86

原创 山东大学创新项目实训个人工作日志(十二)

大河票务网爬虫

2021-05-21 20:33:03 95

原创 山东大学创新项目实训个人工作日志(十一)

景点图片的爬取和存储

2021-05-19 11:52:23 68

原创 山东大学创新项目实训个人工作日志(十)

驴妈妈旅游网站景点门票的爬取

2021-05-17 23:04:52 78

原创 山东大学创新项目实训个人工作日志(九)

飞猪

2021-05-10 17:27:14 72

原创 山东大学创新项目实训个人工作日志(八)

携程

2021-05-08 21:54:33 188

原创 山东大学创新项目实训个人工作日志(七)

基本完成了对去哪儿网的门票信息的爬取。在

2021-04-22 11:39:52 62

原创 山东大学创新项目实训个人工作日志(六)

完成了在携程网站爬取指定城市的特色美食的功能。具体方式是输入用户所选择的城市,然后就可以返回一系列的特色美食的信息。首先是爬取携程的所有城市的ID,并把它保存在一个列表中,用户指定城市后就可以直接从中取出,然后访问到指定城市的页面。获取城市ID: def getCityList(self): html = self.getHtml('https://piao.ctrip.com/ticket/?districtid=1') soup = BS(html, "ht

2021-04-20 23:43:47 99

原创 山东大学创新项目实训个人工作日志(五)

完成了对途牛景点门票的爬取。主要实现的功能就是输入用户的关键词和用户所在的城市(或者选择的城市),就可以搜索出相应的景点所对应的门票的信息来。通过观察可以发现,途牛和大众点评有个相同点,就是它们对每个城市都有一个独立的网站,而我们只要获取了那个网址,就可以实现定位,但是城市一般都是缩写,而且没有什么规律,所以我采用的办法是从主页选择城市的页面的源代码中提取出所有的城市href,然后保存在一个字典数据结构中,这样下次再想用的时候直接查询即可。同时加入了模糊查询功能,因为城市有的带“市”字,而有的不带,所以

2021-04-19 22:46:00 61

原创 山东大学创新项目实训个人工作日志(四)

完成了对大众点评优惠信息

2021-04-17 22:21:08 104

原创 山东大学创新项目实训个人工作日志(三)

主要在完成的工作是爬虫的实现,爬取的网站是大众点评,主要使用了python的requests和BeautifulSoup库。通过解析网站源码可以发现,每个城市都拥有一个网站,而这些网站都可以在选择城市的页面找到,所以通过它获取城市列表,然后根据用户的城市进入相应的网页,在团购网站上进行搜索操作,可以检索出优惠信息。比较麻烦的是详情页面需要登录,这点采用了cookie实现。大众点评的价格信息以及其他的数字信息都是加密之后的,所以之后几天的工作就是把这一部分解码出来,然后对优惠信息进行汇总。...

2021-04-15 23:01:15 128 1

原创 山东大学创新项目实训个人工作日志(二)

目录模糊查询功能Django的安装与使用最近主要实现的功能就是模糊查询功能Django的安装与使用

2021-04-13 21:33:45 123

原创 山东大学创新项目实训个人工作日志(一)

文章目录百度API简介实现功能检索方法的实现百度API简介实现功能检索方法的实现

2021-04-12 20:26:48 276

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除