Python爬虫入门——1.2常用第三方库的安装

        Python作为一门胶水语言,能够在众多领域流行起来的一个很重要的原因是python具有强大的第三方库。这样就可以拾取线程的零件组装一个完整的程序。这就好比某知名厂商一样,核心部件均购买自国外,然后进行组装,贴上巨大的logo即可。在科技领域这样做是没有核心竞争力的,赚得的钱都被国外零件厂商瓜分殆尽。但是在爬虫领域这却是一个非常友好的现象,因为我们不需要再重新写一遍已经存在的东西了。这些第三方库可以使我们的爬虫起到事半功倍的效果。

1.BeautifulSoup库

        在pycharm中安装

        1.1打开Pycharm,在菜单栏选择File ——>Settings

        1.2在弹出的对话框选择Project Interpreter

        1.3在对话框右侧点击   +  按钮,进行添加

        1.4 在弹出的对话框搜索栏输入BeautifulSoup,然后勾选Install to user site,最后点击Install Package即可

2.Requests库

    安装步骤如上

3.Python自带库

        urllib 是 Python 的标准库(就是说你不用额外安装就可以运行这个例子),包含了从网络请求数据, 处理 cookie,甚至改变像请求头和用户代理这些元数据的函数。我们将广泛使用 urllib,所以建议你读读这个库的 Python 文档(https://docs.python.org/3/library/urllib.html)。urlopen 用来打开并读取一个从网络获取的远程对象。因为它是一个非常通用的库(它可以轻松读取 HTML 文件、 图像文件,或其他任何文件流)
 

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值