Python
python爬虫+数据可视化
灬爱码士灬
这个作者很懒,什么都没留下…
展开
-
Python爬虫练习
import re import requests import os import time # 根据歌手的网易云ID爬取其网易云上的歌曲 headers = { 'User-Agent': 'Chrome/10' } def main(): print('例如:华晨宇的网址是:https://music.163.com/#/artist?id=861777', '\n', 'ID就是:861777。') ID = input("请输入歌手ID:") url = '原创 2021-05-23 08:18:02 · 92 阅读 · 0 评论 -
BeautifulSoup在爬虫中的使用实例
# 1.拿到主页面的源代码,然后提取到子页面的链接地址,href # 2.通过href拿到子页面的内容,从子页面中找到图片的下载地址 img --> src # 3.下载图片 import requests from bs4 import BeautifulSoup import time url = "http://www.jj20.com/bz/nxxz/" resp = requests.get(url) resp.encoding = 'gbk' # 处理乱码 # print(re原创 2021-05-15 21:05:33 · 320 阅读 · 0 评论 -
python爬虫案例
通过request拿到网页原源代码 通过re来提取想要的有效信息 import requests import re 请求头 headers = { "User-Agent": "Mozilla/5.0 (Linux; Android 8.0; Pixel 2 Build/OPD3.170816.012) AppleWebKit/537.36 (HTML, " "like Gecko) Chrome/90.0.4430.93 Mobile Safari/537.原创 2021-04-30 17:44:00 · 341 阅读 · 1 评论