爬虫
花间小王子
这个作者很懒,什么都没留下…
展开
-
豆瓣top250图书爬取
爬取网站为:豆瓣链接from bs4 import BeautifulSoupimport requestsfrom openpyxl import Workbookexcel_name = "书籍.xlsx"wb = Workbook()ws1 = wb.active #获取这个工作簿ws1.title='书籍'def get_html(url): header = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10原创 2022-01-17 00:10:25 · 589 阅读 · 0 评论 -
爬取工商银行黄金白银价格并可视化
爬取工商银行黄金白银价格并可视化from bs4 import BeautifulSoup # 网页解析,获取数据from pylab import * #绘制折线图import re # 正则表达式,进行文字匹配`import urllib.request, urllib.error # 制定URL,获取网页数据import matplotlib.pylab as pylimport numpy as npdata0 = []data1 = []data2 = []de原创 2021-07-18 21:22:38 · 1092 阅读 · 1 评论 -
B站何同学毕业视频 弹幕爬取+生成词云
【何同学】我毕业了!! 前女友很喜欢何同学,视频一出就在QQ空间分享,通过自制弹幕词云我也来了解了解这位优秀的同学。通往人生巅峰的路是一步步走去的;通往堕落的路,亦然。终究还是要放下,努力优秀吧!完整代码如下import requests #第三方工具import re #正则import csv #处理保存csv文件格式import wordcloud #词云库impo...原创 2021-08-02 20:39:30 · 630 阅读 · 0 评论