网络爬虫初涉——用python爬取天气

最新推荐文章于 2024-07-09 14:43:42 发布

Meditation-

最新推荐文章于 2024-07-09 14:43:42 发布

阅读量268

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dyk4ever/article/details/108272549

版权

代码如下：

import requests
from bs4 import BeautifulSoup

class get_weather(object):
    def __init__(self):
        self.server = "https://m.tianqi.com/"
        self.target = "https://m.tianqi.com/beijing/"

        #加入header是把爬虫伪装成浏览器进行访问
        self.header = {"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.135 Safari/537.36"}

    def get_it(self):
        req = requests.get(url=self.target, headers=self.header)
        req.encoding = 'UTF-8'
        html = req.text
        #print(html)
        html_bf = BeautifulSoup(html, 'lxml')
        #city = html_bf.find('div', class_='hhx_index_newHead_l')
        city = html_bf.select('.hhx_index_newHead_l text')
        print(city[0].get_text())
        html_bf1 = html_bf.find_all('div', class_='city_weather cbg_b1 citydt')
        for x in html_bf1:
            print(x.get_text())
        #print(html_bf1.get_text())
        time24 = html_bf.find_all('p', class_='hhx_newAllDayTit')
        time_24 = html_bf.find_all('ul', class_='hhx_newAllDayUl')
        print(time24[0].a.get_text())
        for y in time_24:
            print(y.get_text())
        #print(time_24[0].li)



if __name__ == "__main__":
    dl = get_weather()
    dl.get_it()

参考

python爬虫
 python爬取天气预报
 关于Header的参考博文
 查看浏览器Header

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Meditation- CSDN认证博客专家 CSDN认证企业博客

码龄5年

80: 原创

1万+: 周排名

16万+: 总排名

12万+: 访问

: 等级

1650: 积分

1450: 粉丝

290: 获赞

62: 评论

851: 收藏

私信

关注

热门文章

最新评论

使用PCL过程中报出的aligned_free问题记录
Ru1yi: 太狠了，这是真大佬。
PCL1.12.1+VTK9.1+Qt5.14.2VS创建Qt项目在widget上显示点云
Bug放过我: 我设置鼠标控制点云，回调函数一直进不去，看到您的解决实施刷新代码试了下，解决了感谢老哥
PCL1.12.1+VTK9.1+Qt5.14.2VS创建Qt项目在widget上显示点云
北海__: 你是我的神
《点云处理》平面拟合
2301_77225175: 你好，optimizeModelCoefficients这个函数是重新对内点进行最小二乘法拟合吗
《点云处理》点云裁剪
扶摇接海: getRemovedIndices不能提取索引的问题，似乎在初始化condrem时参数设为true就好了，而且getRemovedIndices要放在滤波之后。 [code=cpp] ◆ ConditionalRemoval() template<typename PointT > pcl::ConditionalRemoval< PointT >::ConditionalRemoval ( int extract_removed_indices = false ) the default constructor. All ConditionalRemovals require a condition which can be set using the setCondition method Parameters extract_removed_indices extract filtered indices from indices vector Definition at line 619 of file conditional_removal.h. References pcl::Filter< PointT >::filter_name_. [/code]

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。