前言
嗨喽~大家好呀,这里是魔王呐 ❤ ~!
本次目的:采集tx短片弹幕,并且做词云图可视化分析
这个不少漫迷应该都看过吧~
哪里都好,就是更新太慢了一点,剧情磨蹭了一点,哎
那今天我们就来采集一下它的弹幕吧,看看其他小伙伴的反应怎么样~
知识点介绍:
-
基本思路流程
-
requests模块的使用
-
pandas读取表格数据
环境介绍:
-
python 3.8
-
pycharm
-
requests >>> pip install requests
-
pandas >>> pip install pandas
-
jieba
-
stylecloud
如果安装python第三方模块:
-
win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车
-
在pycharm中点击Terminal(终端) 输入安装命令
原理:
模拟成 浏览器 / 客户端 向 服务器 发送网络请求
如何去实现一个案例:
找数据
静态的数据: 如果在网页源代码当中能够找到的内容 静态的数据
动态的数据: 找不到就是动态的
代码实现过程:
-
发送请求
-
获取数据
-
解析数据
-
保存数据
🎯 博主所有文章素材、解答、源码、教程领取处:点击
代码展示
采集数据
import requests # 发送请求 第三方模块
import csv # 内置模块 保存数据
f = open('弹幕.csv', mode='a', newline='', encoding='utf-8-sig')
csv_writer = csv.writer