文本类及图片音视频类内容内容爬取顺序

(一)文本类:

  1. 引用requests模块 import requests

  2. requests.get(‘url’)下载

  3. open(’《XXX.txt’,‘w’)创建一个txt文档

  4. for循环遍历
    for words in XXX.text:
    try:
    XXX
    (比如k.write(words))
    except:
    pass

    continue

  5. 关闭文档
    k.close()

(二)图片音视频类:

首先图片类:

  1. 引用requests模块 import requests
  2. requests.get(‘url’)下载
  3. pic = open(‘photo.jpg’,‘wb’)创建一个jpg格式(图片内容,需要以二进制wb读写)
  4. pic.write(response.content),将response写入pic内

再音频类:

  1. 引用requests模块 import requests
  2. requests.get(‘url’)下载
  3. music = open(‘music.mp3’,‘wb’)创建一个mp3格式(音频内容,需要以二进制wb读写)
  4. music.write(response.content),将response写入music内。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值