月小水长-CSDN博客

原创 Vibe Coding 了这个古代官员仕途流场和家族背景可视化系统，想请你来翻翻状元们的“履历表“。

底层数据用的是中国历代人物传记资料库，即 CBDB，哈佛大学和北京大学等机构联合维护的一个中国古代传记数据库，这个数据库，从查阅到勘误，从补充到更正，学界下了很多年的功夫。这些问题，正史里翻不出一个干脆的答案，方志里零零散散，全凭印象去猜又不踏实，单纯问 AI 的话，恐怕又容易被胡编乱造讨好人的情绪怪大模型蒙蔽。也许翻着翻着，你会推翻几个自己一直以为理所当然的印象，这正是我做它时，盼着能发生的事，以及希望能体现的一点意义。你有没有好奇过，明朝那些官员，往上数三代，也就是祖辈父辈，都是干什么的？

2026-06-23 20:36:32 434

原创业内首个实事求是的时空文本大数据语义分析 AI Agent

这可能是业界首个在数据采集和研究分析自闭环、实事求是的时空文本大数据语义分析 Agent 平台

2026-06-16 09:55:01 264

原创起猛了，个人微信聊天居然能接入 Agent 爬取 dy 视频了

而且 QClaw 支持个人微信直连绑定，无论身处何地，通过微信发送指令，就能让电脑自动完成报表处理、文件传输、文档编辑等工作，方便！用一会儿 QClaw ，发现并没有小水说的那么神奇，这是因为，小水利用了 skills。但是也仅仅是过了 8 分钟，小水突然想起来，在遥远的东方，有一条小龙虾：Qclaw。再次打开手机，小水查看 QClaw 发来的消息，觉得很满意，转发给老板，小水就经常遇到，毕竟要做的事情总是纷繁复杂的，而大家的时间又是有限的，小水突然想起来还没做，很慌，压力很大，奶茶都被打翻撒了一地，

2026-04-24 10:00:00 315

原创 AI 帮我追新闻，后续有进展直接推

EventPulse是一款智能事件追踪工具，通过AI整合碎片化新闻，帮助用户完整了解事件全貌。它能自动抓取多源报道，按时间轴梳理事件脉络，并提供邮件订阅推送功能，让用户不再错过后续进展。该工具还支持一键生成分享海报，方便传播事件完整信息。适合新闻关注者、行业从业者、研究人员等需要持续跟踪事件发展的用户。无需注册，只需在官网订阅感兴趣的事件，即可获得后续动态的自动推送。

2026-03-29 13:26:22 281

原创 Agent 接入云上自定义 MCP Server，驱动产品评论反馈智能化总结，并自动推送公司微信群

本文分享了如何利用大模型（LLM）、RAG、MCP和Agent技术构建智能化产品反馈分析系统。通过自建MCP Server统一数据接入，结合企业微信机器人实现自动报告发送，并部署到腾讯云LightHouse。系统由Prompt工程驱动LLM完成数据采集、智能分析和报告生成全流程，显著提升了传统企业数据处理的时效性和智能化水平。最终实现了从数据采集到分析决策的全自动闭环，为企业数字化转型提供了可落地的技术方案。

2025-09-20 16:52:57 1096

原创大模型接入自定义 MCP Server，我制作了个免费使用的基金涨跌归纳和归因分析的 Agent

本文介绍了一款基于大模型的基金分析工具开发过程。作者针对基金数据查询和分析耗时的问题，开发了一款整合基金行情和行业新闻数据的Web工具。该工具通过搭建两个MCP Server（基金数据查询和新闻查询服务），采用SSE长连接方式进行数据传输，并接入腾讯混元大模型作为分析引擎。文章详细介绍了MCP Server的开发部署过程，包括数据接口封装、服务配置、Nginx反向代理优化等关键环节，最终实现用户只需输入基金代码即可获取由大模型生成的综合分析报告。工具已公开免费使用，但作者特别声明不构成投资建议。

2025-09-15 13:57:43 1107

原创开发了一个超灵活配置的 poi-marker 地图标注网站

摘要：开发者推出了一款免费在线地图标注工具，支持数据导入、自定义标注颜色大小、多种底图切换及灵活样式设置。该工具基于LeafLet地图库，可自动定位和缩放，支持导出PNG或HTML文件。适用于个性化地图标注需求，无需下载应用，已稳定运行三年。访问地址：https://tools.buyixiao.xyz/poi-marker-map

2025-08-21 00:29:21 1242

原创苏轼同款，一键可视化你的社会和亲戚关系图

一键 get 苏轼同款，你自己的社交龙卷风

2025-08-18 15:22:30 811

原创忍不了，独立开发了一款明末模拟器

于是这个周末，我花了几个小时的时间，自己开发了一款明末模拟器，这是一个网页游戏，免费游玩，地址见文末，在这个游戏中，可以在明末关键历史事件中做出你自己的选择，你的每一个抉择都可以影响历史的进程，这是一个架空历史的设计，在指定的历史节点上可以有很多选择，比如在山海关，你可以尝试阻止吴三桂引清兵入关，

2025-08-04 12:41:05 1206

原创面试了全球首个 AI 全栈高级 IDE CodeBuddy，当场就下了 Offer

最近收到了一份求职简历，自称是全球首个产设研一体 AI 全栈高级工程师，名字叫 CodeBuddy IDE，已经正式入职了几个员工了，写代码都不太得劲，今天让我来面试下这个 CodeBuddy IDE，看看到底怎么回事，见过太多只会背八股文了，这次我打算现场直接让 CodeBuddy IDE 上代码，毕竟 talk is cheap，show me code给大模型的指令一定要开门见山，去除废话，提高信息量，同时确保给足必需前提条件等信息，保证输出不会偏颇。

2025-07-26 15:04:03 1082

原创手搓了两个 MCP Server，独立开发基金涨跌大模型分析工具

本文介绍了一个基于大模型的基金分析工具网站开发过程。作者通过MCP（Model Context Protocol）技术接入实时基金数据，采用FastMCP框架开发数据服务，并选择Gemini-2.5-flash作为基座大模型。该工具支持输入基金代码和时间段后，自动获取并分析基金历史表现和相关新闻影响，以通俗易懂的方式呈现分析结果。系统采用Streamable HTTP传输机制，结合数据缓存优化性能，最终通过Flask和Next.js实现前后端服务。该工具能帮助投资者快速了解基金走势及其影响因素，但作者强调该

2025-07-24 20:53:09 1267

原创 Android Studio 打 release 包 Algorithm HmacPBESHA256 not available 问题解决

在 Settings->Build,Execution,Development->Gradle 处，如果没有 JDK 12 或者 13，点击 Download JDK，选择一个 13 版本下载 Apply 后再打包就 ok 了。解决办法也很简单，把 JDK 升级到 12 或者 13 就行，实测升级到太高，比如 17、18 容易出现新的问题。今天 Android Studio 在打 Release 包的时候，碰到这个问题，而一般用的是 Java8 或者 Java 11，就碰到这个问题了，

2025-07-10 17:43:36 531

原创 Django 使用 matplotlib 遇到 RuntimeError: main thread is not in main loop 解决办法

matplotlib 默认使用的后端（如 TkAgg）依赖于 GUI 环境，而 Django 运行在服务器端，没有这样的环境。通常是因为 matplotlib 默认会使用 GUI 后端，而 Django 是一个 Web 框架，在服务器端运行，没有 GUI 环境，且 matplotlib 的 GUI 后端在非主线程的上下文中使用时会出现问题。在 django 开发的接口服务中需要返回由 matplotlib 生成的图片，第一次页面请求接口正常，刷新页面后出现了以下异常导致服务崩溃，

2025-04-02 23:45:12 785

原创 XPath 语法无法定位到 svg 标签

有一个真实存在的 html，里面有一个 svg 标签，且路径如下，div -> span -> svg。实测发现这样无论怎样不行，几经搜索到 StackOverflow 才知道，需要使用下面的语法。通常情况下，我们可以通过下面的 xpath 语句获取到这个 svg 标签，这样才能正确获取到，事实上，获取 svg 标签下面的。

2025-03-09 17:03:03 674

原创 git 仓库下 .git/objects/pack/ 文件太大解决办法

连接起来，意味着首先清理所有分支的引用日志中的旧条目，然后在仓库中执行更彻底的垃圾收集。这种组合通常用于在清理引用日志之后，进一步清理和优化仓库。连接，这意味着如果第一部分命令成功执行，那么第二部分命令也会执行。总的来说，这个命令会立即执行更彻底的垃圾收集，包括清理无用的对象和优化仓库存储。总的来说，这个命令会立即清理所有分支的引用日志中的旧条目。实测省出来出来 20 多G空间，执行 20 分钟左右。命令由两部分组成，每部分都用。

2024-10-11 21:33:53 2428

原创 Ubuntu 20 安装 uwsgi 失败解决办法

这一切都可以在虚拟环境激活的时候完成，不需要卸载 Python 环境或者重新创建虚拟环境，非常简单。解决办法：安装对应的 Python 对应版本的编译依赖包即可。然后直接在虚拟环境里安装 uwsgi 就可以了。Python 版本：python3.8.10。环境：Ubuntu 20.04 LTS。虚拟环境路径：/home/venv。激活虚拟环境后，安装 uswgi。

2024-07-17 17:20:49 890

原创 2018-2022 年份微博签到数据集

前两年采集的深圳签到数据是 2022 年是当年的尚可，这次虽然时间跨度只有两个月，但是由于时间太过久远，但是颇费了一番心力，还好最终老师只需要每个月 10000 条左右，我赶紧停止了集群的采集，一看代理池马上欠费了。微博签到数据的采集，时间越久越难采集，看到网上有很多分享 2014 年全国微博签到数据的，我看了下其实那个只是 poi 数据，而且绝大部分的 poi 被重置了，poi 链接打不开，查无此微博。前阵子接到一个实验室老师的需求，采集五年前（2024-5=2019）过年前后的北京微博签到数据。

2024-07-10 00:24:58 1271 7

原创 Android ANR 日志导出及分析

adb shelllsexit然后尝试尝试导出，发现权限不足，这是因为需要手机 root。退而求其次，使用bugreport最终在导出一个 zip 压缩文件，解压后 anr 在下述路径中其中的 anr 日志文件没有后缀名，其实是普通文本文件，可以用记事本打开。

2024-04-23 22:08:45 1113 1

原创 Android Studio 通过 WIFI 调试手机 app

其中 xxxx 就是手机被分配的局域网 ip，可以系统设置 --> 关于手机 --> 状态消息（信息）里看到。其中端口号 5555 也可以指定其他值，该命令将会重启手机上的 adbd，该步成功的话无输出。第一种方法：只需要断开其他 usb 或者 wifi 连上的设备，只保留我们的目标设备手机即可。，则是由于连上了多个设备（ usb 连上的设备 + wifi 连上的设备），(最好只看到一个连上的设置，如果有多个，可能有麻烦，解决办法见后文)首先第一步，PC 和手机都需要连在同一个局域网 WIFI。

2024-04-02 21:56:19 1731

原创 Ubuntu 上 Pyexecjs报错 execjs._exceptions.ProgramError: SyntaxError: Unexpected token ?

这是因为 nodejs 版本太低了。

2024-03-05 17:10:55 1333

原创携程上海酒店数据采集及可视化

价格越低，消费者评分的方差就越大，1-5 分都有分布，价格越高，评分越高，几乎都在 4 分以上。我觉得这有两个原因，第一，价格高的酒店数量远远不如酒店低的数量，第二，花了 2w 块住一晚酒店，那体验能不好吗？价格多分布在区间的下行，即大部分酒店价格较低，评分则多分布在区间上行，大部分酒店评分较高，这反映了上海市酒店服务业的整体水平较高。从价格的中位数来看，只平平无奇，但是从平均价格来看，上海的酒店价格至少是我老家，湖南一个省内著名省外无名三线城市价格的 2 倍。最后，把酒店价格可视化地展示在上海地图上。

2024-01-12 09:54:55 2271 7

原创百度统计代码安装出现「referrer被禁用」或者「代码未生效」解决办法

今天安装官方指定的流程和位置安装百度统计代码时，出现了**「referrer被禁用」**，于是上网一搜，几乎绝大部分搜索结果都是让我在 head 标签内加下面一行代码。，这一搜，由于引发这个未生效的原因有很多种，我渐行渐远了，后来直接把这行代码删了，就安装成功了，笑死。于是我索性把下面这行替换成上面那行，结果就出现了。

2023-07-06 11:02:28 2211

原创在线配置生成动态排序柱状图工具上线

自定义数据，自定义图标，超强在线动态排序柱状图生成工具。

2022-10-17 12:42:18 1323

原创中国-省-市三级地图及世界地图在线编辑可视化工具上线

中国、省、地级市三级联动地图，可钻入钻出，可以选择全国地图、任意省份地图、任意地级市等层次地图进行编辑可视化

2022-10-12 14:54:12 34942 21

原创 streamlit 自定义跑马灯组件

streamlit 自定义 component 实现跑马灯，已发布 pypi

2022-10-10 00:59:09 1199

原创 streamlit 集成百度统计或谷歌分析的三种方法

streamlit 是当前炙手可热的快速搭建机器学习和数据分析工具站点的 Python web 框架，今天来探讨下有关 streamlit 网站统计相关的问题。给 streamlit 统计 PV 大概有三种方法。笔者环境：ubuntu 18.04 + Python 3.8.10 + streamlit 1.1.3.0第一种是使用 streamlit.components.v1 注入 js 代码，例如这种方法简单，但是对应多页面应用就比较麻烦了，每个 python 脚本都要复制一份同样的内容（may

2022-10-05 23:01:03 1166

原创 2022 年 8 月初北上广深杭热门签到打卡点微博数据集

北上广深杭热门的微博打卡点约 20w 数据集，时间跨度为 2022 年元旦至 8 月 9 日。

2022-08-12 22:40:56 1055 5

原创 0.43 版本frp 穿透后 404，内网访问正常

内网访问正常，使用新版 0.43 frp 穿透后 404

2022-06-02 21:06:10 1991 1

原创 2022 年最新微博签到数据集

微博签到数据集，目前全网搜到的多为较老的 800w 数据集或已下线的接口，没有多大参考价值。所以自研了一个系统，可以抓取全国任意城市的微博签到数据，单城市签到微博去重最多可达 100w+，字段包括经纬度、签到地点、微博链接、博主链接、内容、图片链接（图片可下载）、发布时间、转评赞数等数十个字段。下面是深圳 2022 年 4 月底最新微博签到数据集：共计 50w，csv 文件 330M。除了深圳，全国其他任意城市也可，如果一个城市需要更多数据，则需要定时增量抓取，北上广深杭一线城市达到 100w 数据

2022-05-09 11:52:49 6301 22

原创 RecyclerView 设置 maxHeight 无效的解决办法

遇到了这个如题所示问题，网上搜的都是自定义一个 MaxHeightRecyclerView 继承自 RecyclerView，然后重绘它的 onMeasure 方法，大概如下： @Override protected void onMeasure(int widthMeasureSpec, int heightMeasureSpec) { if (mHeightMax > 0) { heightMeasureSpec = MeasureSpec.

2022-04-21 11:27:36 5161 8

原创 Django 站点图标设置本地生效，远程服务器部署不生效解决

遇到这种情况多半是用了path('favicon.ico', serve, {'path': 'img/fav.ico'}),这样本地生效，远程不生效。解决办法是在 base.html 中 header 间添加一行<link rel="shortcut icon" href="{% static 'img/fav.ico' %}">

2022-02-19 23:51:11 978

原创开源：用户微博备份助手浏览器扩展

扩展介绍得空写了个微博用户备份助手，它是一款浏览器扩展（插件）。它的作用是备份用户自己或者任意微博用户的微博数据，并将结果保存到本地的 lxsx 文件。使用指南1、确保在浏览器登录了 weibo.cn2、在 weibo.cn 或者 weibo.com 站点内的微博用户主页上点击扩展图标，会显示如上图，自动解析数字 uid，然后点击开始抓取按钮即可；如果自动解析失败，可手动输入然后抓取；如果自定义微博主页用户的数字 uid 获取方式为：在它的主页上任意一条微博上的用户名右键在新标签页打开，浏览器

2022-02-16 18:57:10 1841

原创开源 | 写了个微博去广告、屏蔽拉黑插件

去广告，屏蔽关键词，拉黑用户，组织乱序微博按照时间线排列等多功能，并且开源。

2022-01-27 18:07:07 2451

原创【开源】浏览器书签层级可视化

无论层次多深的书签，一点直达，解决痛点。

2021-12-30 08:30:00 1090

原创 geopy 库 ConfigurationError 错误

错误详情geopy.exc.ConfigurationError: Using Nominatim with default or sample `user_agent` "geopy/2.2.0" is strongly discouraged, as it violates Nominatim's ToS https://operations.osmfoundation.org/policies/nominatim/ and may possibly cause 403 and 429 HTTP e

2021-12-21 17:15:10 2672 3

原创微博评论爬虫解决 meiko 之问，S 11 冠军皮肤选猫咪还是选露露呢

S11 结束了，EDG 牛逼就完事了。作为 Meiko 十年老粉，我看到他发了这样一条微博：所以是选露露还是猫咪呢？广大网友在评论区讨论得不亦乐乎。我突然灵光一闪，可以用爬虫把这些评论抓取下来，提取每一条评论中的包含露露、猫咪等关键词，每一条评论出现一次 vote 就 + 1，然后可视化出来大家都想选啥英雄，说干就干。昨晚下班后熬夜干到快 12 点，终于 done 了。差不多把这 3 w条评论全部抓取下来了，评论数据时间是截止 2021.11.11 晚上 11 点。然后就是抽取分析统计了，核

2021-11-13 16:54:22 1062

原创微博位置爬虫发布

微博数据分析经常需要和地理位置相关联，比如查看某一话题下发博人员地理分布，或者用户爬虫下某人轨迹分布，等等；而这次的微博位置爬虫则是直接以位置为切入点爬取微博，只需要输入一个地名，就能抓取在该地点发过的微博具体信息，表结构类似话题爬虫。这个位置爬虫的结果可以和用户信息爬虫联动，比如有这样一个分析任务：去北京环球影城的人，都发了什么微博，男生多还是女生多，年龄群体分布怎么样，等等。都可以先用这个微博位置爬虫，爬完后的 csv 交给用户信息爬虫处理即可。闲话不多说，首先在公众号月小水长后台回复微博

2021-09-17 10:43:43 3114 1

原创不写一行，自动生成爬虫代码

从今天开始，开一个专栏，编程每日一问，如其名，旨在分享探讨编程中那些实用的技巧或知识，多短小精悍。今天的话题是，如果不写一行代码，完成一份最小可运行性的爬虫代码。直接举 com 微博评论爬虫这个例子，打开下面这个网网址https://weibo.com/1192329374/Knsnj9B3D按照以下步骤来在 Network 栏目 Filter 处输入 ’build’ 过滤请求，找到评论获取的那个接口在接口上右键，Copy --> Copy as cURL(bash)；（cur

2021-09-04 11:04:19 1380

原创开源一个豆瓣用户广播爬虫

应不住读者的请求，打算新开一个豆瓣系列的爬虫，主要是为了爬取豆瓣的小组和用户信息，并且全部开源出来。今天这篇主要是分享豆瓣用户广播爬虫，可能还是有不少同学对豆瓣广播不熟悉的，看下图就很清楚，豆瓣的广播有点类似于 QQ 空间的说说，但是多了一些豆瓣自己的元素，比如，”在看“、”在读“，”听过“ 这些 Action。抓取的主要内容是广播里的听说读看这四部分（不包括转发的内容），但是听这一个又包括在听，想听，听过等，所有种类比较多，同时字段又不规则，所以本次保存的文件形式不再是 csv，而是 json；我个

2021-08-25 10:39:36 934

原创 2021 新版微博转发爬虫发布

今日发布的微博转发爬虫，是之前从没有发布过的微博爬虫，一样是付费内容，主要实现概述如下：根据指定的微博 mid 爬取该微博的转发信息。爬取该微博的转发微博的转发信息；甚至转发地转发地转发，可以无限地套娃…爬取并保存的，字段信息如下：字段名解释mid纯数字形式的微博唯一标识，可与字母+数字形式 id 互转publish_time发布时间user_name微博作者名user_link微博作者链接content内容weibo_link微博链

2021-07-17 18:36:19 1455

某乎问题下回答数据集 CSV

【华中农业大学黄某若教授被课题组十一名成员联合举报学术造假】的回答数据集，字段包括： 'question_title': [], # 问题描述 'question_url': [], # 问题链接 'question_create_time': [], # 问题创建时间 'answer_url': [], # 回答链接 'answer_create_time': [], # 回答创建时间 'author_name': [], # 答主名 'gender': [], # 答主性别 'author_url': [], # 答主链接 'author_follower_count': [], # 答主粉丝数 'excerpt': [], # 回答概述 'answer': [], # 回答详情等

2024-07-09

TA关注的人

某乎问题下回答数据集 CSV

CUFE 思享推送经验心得

RUC 思享推送经验心得

BIT 思享推送经验心得

Yelp 爬虫，洛杉矶 500 家饭店数据样例

2020 英雄联盟全球总决赛 SN vs DWG 约 50000 条弹幕文本

大研古镇景点话题数据集

ChatGPT 话题数据集（英文）

CBDB 数据集 blog-main 表简体中文版

百度贴吧图片自动下载

U盘快捷方式查杀工具

数据结构之无向图最全函数实现C语言版

C语言实现矩阵的乘加求逆运算

C语言实现音乐播放器

fastjson使用实例

Python GUI之模拟Tim登录界面

中南大学强智教务系统成绩爬虫

alibaba团队fastjson最新架包

opencv图片裁剪python代码

安卓超级日记本

发布自己的轮子到 pypi 后 pip install 确是 not found 的原因