苏生不惑原创文章,加入我的知识星球
之前分享过我写的工具2023 更新版:苏生不惑开发过的那些原创工具和脚本 ,因为要输入自己账号的cookie,总有人问我cookie到底是什么?今天写篇文章说说,维基百科对cookie的解释:
HTTP cookie,简称cookie,是浏览网站时由网络服务器创建并由网页浏览器存放在用户计算机或其他设备的小文本文件。Cookie使Web服务器能在用户的设备存储状态信息(如添加到在线商店购物车中的商品)或跟踪用户的浏览活动(如点击特定按钮、登录或记录历史)。
简单来说cookie就是账号的代号,有了cookie相当于登陆你的账号,可以访问和操作你的个人数据,因为有些网页需要登陆才能访问,如果在工具里做个登陆功能很麻烦,用cookie是最简单的方式,那怎么获取自己账号的cookie呢?谷歌浏览器右键检查打开开发者工具,选择network找到左侧请求的微博地址,比如https://m.weibo.cn/profile/1744395855 , 右侧request headers里的cookie就是,注意cookie会失效,重新获取就行。
当然也可以用Charles代理工具抓包。
抓https网页需要设置ssl proxying setting。
用cookie下载微博评论 2024 批量下载微博内容/图片/视频/评论/转发数据,导出excel和pdf
不过下载的评论比实际评论数少很多,可能被微博过滤了,点击加载更多没反应。
导出的excel数据包含微博昵称,微博uid,评论时间,评论内容,评论地区,回复数,点赞数等。
对excel文件分析评论IP地址分布图:

对excel文件分析评论内容生成的词云图:
我之前写的雪球批量下载工具也是一样的2023 年苏生不惑开发的第 1 个工具:雪球批量下载 ,这里用的是edge浏览器:
还有批量下载知乎问题下的回答工具再次更新,2024 批量下载知乎回答/文章/想法/专栏/视频导出 excel 和 pdf ,有问题加微信 sushengbuhuo
导出的excel包含每个回答的回答链接,回答作者,回答内容,回答时间和回答更新时间,本来想把回答里的图片也下载了,但是有些回答的图片太多了。
再说下命令行工具很多人问命令行是什么?有什么用,由于没有界面,如果报错用不了也看不到提示,可以在工具目录打开命令行,Windows10上推荐用https://github.com/microsoft/terminal/releases ,在应用商店搜索terminal安装。个性化设置可以参考这个https://github.com/lextm/windowsterminal-shell
如果有错误可以看到,比如你电脑开了代理就用不了公众号文章下载工具。
我写的这个工具支持参数,所以你可以写脚本来调用,先将wechat_down.exe这个文件加入环境变量,打开电脑设置输入环境变量,输入文件路径就行了。效果:
其他命令行工具也是一样的下载b站视频最简单的方法,还能去水印 https://github.com/nilaoda/BBDown ,比如使用BBDown -tv https://www.bilibili.com/video/BV11S4y1T7ca
下载b站无水印视频:前后对比效果,左上角bilibili的水印字样没了:
最近原创文章:
再次更新:2023批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,文章数据含阅读数/点赞数/在看数/留言数
微博图床又搞事情不能用了,盘它,我顺便写了个微博图片/视频/内容/文章批量下载工具
如果文章对你有帮助还请
点赞/在看/分享
三连支持下, 感谢各位!