python网络爬虫与信息提取-20200406

最新推荐文章于 2024-09-09 00:00:00 发布

奇了怪了马

最新推荐文章于 2024-09-09 00:00:00 发布

阅读量190

点赞数

分类专栏：爬虫文章标签： python 大数据

本文链接：https://blog.csdn.net/eglantine79/article/details/105345583

版权

爬虫专栏收录该内容

2 篇文章 0 订阅

订阅专栏

通过学习，我们可以使用request库自动爬取html页面，自动网络请求提交，网络爬虫排除标准，解析html页面，并了解正则表达式，能够提取页面关键信息，通过实战项目透彻掌握网络数据爬取和网页解析的基本能力。

文本工具ide 选用sublime txt
集成工具ide pycharm anaconda 我安装了anaconda 就用的这个在这里插入图片描述

这里我尝试了爬取豆瓣的页面信息

import requests
def getHTMLText(url):
    try:
        r= requests.get(url, timeout=30)
        r.raise_for_status()
        r.encoding= r.apparent_encoding
        return r.text
     except:
        return "报错报错"
 if __name__ == "__main__":
    url = "https://www.douban.com"
    print(getHTMLText(url))

返回报错报错

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

奇了怪了马

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python网络爬虫与信息提取-20200406

通过学习，我们可以使用request库自动爬取html页面，自动网络请求提交，网络爬虫排除标准，解析html页面，并了解正则表达式，能够提取页面关键信息，通过实战项目透彻掌握网络数据爬取和网页解析的基本能力。文本工具ide 选用sublime txt集成工具ide pycharm anaconda 我安装了anaconda 就用的这个...
复制链接

扫一扫