自学python爬虫的第一天

目录

1.首先明确爬虫是什么

2.编写爬虫是我们都需要什么包

3.这是一个简单的爬取网页信息的爬虫


1.首先明确爬虫是什么

爬虫:即网络爬虫,也叫做网络机器人,可以代替人们自动地在互联网中进行数据信息的采集与整理,

大家可以理解为在网络上爬行的一只蜘蛛,互联网就比作一张大网,而爬虫便是在这张网上爬来爬去的蜘蛛,如果它遇到自己的猎(所需要的资源),那么它就会将其抓取下来。

2.编写爬虫是我们都需要什么包

re     用于正则表达式

requests      http请求

lxml            页面解析

redis 非关系型数据库

过多的我就不介绍了

3.这是一个简单的爬取网页信息的爬虫

import requests  #首先导入requests
if __name__=="__main__":
    #1.指定url
    url="https://cn.bing.com/"
    #2.发起请求
    Res = requests.get(url=url)
    #3.获取相应数据
    P_text = Res.text
    print(P_text)
    #4.持久化存储
    with open('./Bing.py','w',encoding='utf-8') as Fp:
        Fp.write(P_text)
    print("爬取结束??????")

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值