简单的爬虫代码

最新推荐文章于 2024-05-09 23:59:03 发布

性感的甜妹子呢

最新推荐文章于 2024-05-09 23:59:03 发布

阅读量336

点赞数

文章标签： python

本文链接：https://blog.csdn.net/lysmlie/article/details/130237351

版权

import requests
import re
import csv
import codecs

urls = []

urls.append("https://y.qq.com/")
urls.append("https://www.kugou.com/")
urls.append("https://music.163.com/")
urls.append("https://www.bilibili.com/")
urls.append("https://music.91q.com/")


with open("C://Users//86171//PythonProject//study//pachong//test.csv", "ab+") as f:
    f.write(codecs.BOM_UTF8)
f = open("C://Users//86171//PythonProject//study//pachong//test.csv", "a+", encoding="utf-8")

csvwriter = csv.writer(f)
csvwriter.writerow(["音乐库", "音乐库特色", "音乐库介绍"])

for url in urls:
    resp = requests.get(url)
    print(resp.encoding)

    resp.encoding = 'GBK'

    obj1 = re.compile(r'<title.*?>(?P<title>.*?)</title>', re.S)
    obj2 = re.compile(r'<meta.*?name="keywords".*?content="(?P<keywords>.*?)".*?>', re.S)
    obj3 = re.compile(r'<meta.*?name="description".*?content="(?P<description>.*?)".*?>', re.S)
    resp.encoding = 'utf-8'

    result1 = obj1.finditer(resp.text)
    result2 = obj2.finditer(resp.text)
    result3 = obj3.finditer(resp.text)

    lis = []
    for it in result1:
        print("音乐库：", it.group("title"))
        lis.append(it.group("title"))
    for it in result2:
        print("音乐库特色：", it.group("keywords"))
        lis.append(it.group("keywords"))
    for it in result3:
        print("音乐库介绍：", it.group("description"))
        lis.append(it.group("description"))
    print(lis)
    print()

    csvwriter.writerow(lis)

    resp.close()
print('数据爬取完成!')

f.close()

性感的甜妹子呢

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
简单的爬虫代码

print("音乐库介绍：", it.group("description"))csvwriter.writerow(["音乐库", "音乐库特色", "音乐库介绍"])print("音乐库特色：", it.group("keywords"))print("音乐库：", it.group("title"))print('数据爬取完成!
复制链接

扫一扫