@[toc]
一、背景介绍
你好,我用python开发了一个GUI桌面软件,作用是爬取ytb指定视频的评论,6个关键字段,含:
评论id、评论内容、评论时间、评论作者昵称、评论作者频道、点赞数
1.1 软件说明
几点重要说明:
1.2 效果演示
运行截图1:
运行截图2:
1.3 演示视频
小破站演示视频:BV1A94y147dd
二、科普知识
2.1 关于视频id
油管视频id号,比如, https://www.youtube.com/watch?v=9lc6D6nPd38 这个视频链接的视频id就是"9lc6D6nPd38"。YouTube的每个视频都是如此。
2.2 关于评论时间
YouTube网页上是看不到绝对时间(年月日时分秒格式)的,只能看到相对时间(几个月前、几天前之类),此软件支持爬取绝对时间。
三、爬虫代码
3.1 界面模块
软件界面采用tkinter开发。
主窗口部分:
按钮控件部分:
3.2 爬虫模块
通过请求YouTube评论的ajax接口实现,详见文末完整代码。
3.3 日志模块
好的日志功能,方便软件运行出问题后快速定位原因,修复bug。 核心代码:
日志截图:
以上。
三、首发公号
本文首发公众号【老男孩的平凡之路】,欢迎交流!!