Python实用数据分析哪些地方,十一黄金周值得一去!

本文利用Python爬取去哪儿网全国32个省市41611条景区信息,包括景区名、等级、地点等,对5A、4A、3A级景区销量和人气进行对比分析,发现东部地区5A级景区数量较多,西部虽美景多但开发不足。山东在各级景区数量上领先,3A景区人气普遍较低。通过高德地图API进行地理编码转换,并通过地图可视化展现景区分布。建议选择人少景美的4A级景区如成都熊猫基地,以及长沙、张家界等地游玩。
摘要由CSDN通过智能技术生成

中国地广人不稀,旅游资源非常丰富,古文化遗址、抗战遗址、山川、河流等等,在选择目的地的时候,不少人都会非常纠结,不知道去哪更好。为了以后不再纠结,打算深度解析全国的旅游景点分布。

去哪儿网有着非常丰富的旅游信息,不但几乎涵盖了全国所有景点,而且使用去哪儿网购买景区门票的人也非常多,所以笔者将爬取去哪儿网全国 32 个省市的所有景点数据。(没有抓取香港和澳门的数据,这边的景点并没有分 5A、4A)

去哪儿网的门票服务中暂时还没有开通 API 服务,所以只能对网页解析爬取。要抓取的数据有:景点名、景区等级、地点、景区简述、价格、销量以及热度。

将需要的数据进行定位,一层一层解析,就可以把所需的全部内容抓取下来了。但并不是每一个景点的信息都是全的,所以笔者加了一个 try/except 进去,虽然代码有变长,但是整个程序变得更加健壮。最终,一共抓取了 41611 条景点信息。


在学习过程中有什么不懂得可以加我的
python学习交流扣扣qun,784758214
群里有不错的学习视频教程、开发工具与电子书籍。
与你分享python企业当下人才需求及怎么从零基础学习好python,和学习什么内容
for i in s: 
    inf = {} 
    try: 
        inf['level'] = i.find('span', class_='level').text[0] 
    except Exception as e: 
        inf['level'] = '0' 
    try: 
        inf['price'] = i.find('span', class_='sight_item_price').find('em').text 
    except Exception as e: 
        inf['price'] = '' 
    try: 
        inf['name'] = i.find('a', class_='name').text 
    except Exception as e: 
        inf['name'] = '' 
    try: 
        inf['num'] = i.find('span', class_='hot_num').text 
    except Exception as e: 
        inf['num'] = '' 
    try: 
        inf['add_pro'] = i.find('span', class_='area').find('a').text.split('·')[0] 
        inf['add_city'] = i.find('span', class_='area').find('a').text.split('·')[1] 
    except  Exception as e: 
        inf['add_pro'] = i.find('span', class_='area').find('a').text 
        inf['add_city'] = i.find('span', class_='area').find('a').text 
    try: 
        inf['hot'] = i.find('span', class_='product_star_level').find('em').get('title').split(':')[1] 
    except  Exception as e: 
        inf['hot'] = '' 
    try: 
        inf['descri'] = i.find('
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值