python
文章平均质量分 91
IamCerian
我曾幻想有双翅膀
展开
-
python爬虫:检索B站视频提取弹幕构建词云
文章目录1、思路2、源码3、效果展示1、思路B站的视频弹幕由三层关键词可以锁定,第一层是检索的关键词,第二层是每个视频的bvid,第三曾是每个视频的oid,相关的获取API网上都有。爬虫使用的是request,构建词云使用的wordCloud,中间还嵌套使用了正则、数据分析部分内容。总体的思路是:根据关键词检索视频根据每个视频的标示bvid得到标示该视频弹幕的oid根据oid请求弹幕,并解析弹幕数据根据获取的弹幕数据构建词云2、源码#!/usr/bin/env python# -*原创 2020-07-26 11:17:51 · 919 阅读 · 0 评论 -
正则表达式基础——以Python爬虫为实例
本篇文章以Python爬虫为实例,以应用为目标介绍正则表达式获取某网站图片的爬虫算法正则——初识正则——元字符正则——分组正则——常用函数1. 爬虫算法import reimport urllib.requestdef getHtml(url): page=urllib.request.urlopen(url) html=page.read() return原创 2017-10-11 15:47:53 · 1566 阅读 · 0 评论 -
PyCharm导包问题解决
PyCharm导包问题解决报错展示Pycharm初次安装完成是不内含众多所需包的,典型的报错是from PIL import Image ##调用库运行这行代码会报以下错误:“Unresolved reference ‘PIL’ less… (Ctrl+F1)This inspection detects names that should resolve b...原创 2019-01-07 19:41:49 · 2924 阅读 · 0 评论