简单的爬虫代码

import requests
import re
import csv
import codecs

urls = []

urls.append("https://y.qq.com/")
urls.append("https://www.kugou.com/")
urls.append("https://music.163.com/")
urls.append("https://www.bilibili.com/")
urls.append("https://music.91q.com/")


with open("C://Users//86171//PythonProject//study//pachong//test.csv", "ab+") as f:
    f.write(codecs.BOM_UTF8)
f = open("C://Users//86171//PythonProject//study//pachong//test.csv", "a+", encoding="utf-8")

csvwriter = csv.writer(f)
csvwriter.writerow(["音乐库", "音乐库特色", "音乐库介绍"])

for url in urls:
    resp = requests.get(url)
    print(resp.encoding)

    resp.encoding = 'GBK'

    obj1 = re.compile(r'<title.*?>(?P<title>.*?)</title>', re.S)
    obj2 = re.compile(r'<meta.*?name="keywords".*?content="(?P<keywords>.*?)".*?>', re.S)
    obj3 = re.compile(r'<meta.*?name="description".*?content="(?P<description>.*?)".*?>', re.S)
    resp.encoding = 'utf-8'

    result1 = obj1.finditer(resp.text)
    result2 = obj2.finditer(resp.text)
    result3 = obj3.finditer(resp.text)

    lis = []
    for it in result1:
        print("音乐库:", it.group("title"))
        lis.append(it.group("title"))
    for it in result2:
        print("音乐库特色:", it.group("keywords"))
        lis.append(it.group("keywords"))
    for it in result3:
        print("音乐库介绍:", it.group("description"))
        lis.append(it.group("description"))
    print(lis)
    print()

    csvwriter.writerow(lis)

    resp.close()
print('数据爬取完成!')

f.close()

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值