自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 对着爬虫网页HTML学习Python正则表达式

文章目录1.正则表达式初探2.用正则表达式匹配更多模式2.1.利用括号()进行分组2.2.利用管道|匹配多个分组2.3.用问号?实现可选匹配2.4.用星号*实现0次或多次2.5.用加号+实现1次或多次2.6.用花括号{}匹配特定次数3.贪心和非贪心匹配4.字符类型5.split()函数1.正则表达式初探用比较经典的例子,查找一段文本中的手机号码。比如对于文本“我现在用的电话是188-8888-8888,之前那个186-6666-6666已经不用了”,我们想获取其中的手机号码信息,用正则表达式可以这么做呢

2020-12-20 20:17:40 263 2

原创 北上广深自如合租房图鉴

1.合租房源基本情况我们爬取了自如北上广深合计4.58万租房信息,其中合租房3.37万,占比75%。自如在其大本营北京房源最多,达到了1.62万间,其次是上海为1.14万间。相比之下,其在广深的房源数量级并不高。在单间平均面积上,基本都超过了10平米,其中北京和上海的平均面积都超过了12平米。在单间的平均月租金上,北京高达2,952,远高于其他城市。而广州的平均月租金仅1,651,几乎只有北京的一半。同样作为超一线城市,北京的租房压力也太高了,而广州的租房压力似乎不会成为压力。2.单间大小和

2020-12-18 23:23:57 457 1

原创 Python爬取自如北京2.3万条租房信息,发现快租不起房子了

文章目录1.概述2.数据采集-爬虫2.13.数据处理-清洗4.数据分析-统计5.数据展示-可视化6.总结1.概述2.数据采集-爬虫自如的租房信息每个筛选结果最多展示50页,约1500个左右。考虑到很多地区的租房数量超过1500个,我们可以通过增加筛选的方式进行遍历获取全部租房信息。以北京为例,由于自如大本营在北京,我们发现北京有租房信息2.3万条以上,因此这里采用的是地区-房价区间 2个筛选项进行选择,其中筛选项为自定义以500位颗粒度。在爬虫过程中,我们会发现频繁的请求数据会被封IP,同时自如的

2020-12-16 02:09:23 2031 6

原创 Python探秘大众点评北京火锅店第①期:好吃的火锅在哪里?

文章目录1. 说明2. 北京火锅店基础数据2.1. 火锅分类2.2. 各地区火锅分类2.3. 各地区火锅店数量3. 北京火锅店评分数据3.1. 评分直方图3.2. 各地区商家评分箱线图3.2. 各地区口味评分箱线图3.3. 各地区环境评分箱线图3.4. 各地区服务评分箱线图4.评价数及人均消费4.1. 整体评价数分布本来打算今天(12月6日,我们上班)中午和朋友们去吃火锅来着,然后提前在大众点评上探秘一下好吃的火锅在哪里。结果因为连续的熬夜加班,也便没时间去吃火锅了,改到圣诞节那个周末吧(12月26日我们

2020-12-07 17:29:26 1775 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除