- 博客(5)
- 收藏
- 关注
原创 Bilibili获取视频地址和一级评论、二级评论
本文介绍了一个B站视频评论爬取脚本,可通过API接口获取指定视频的一级评论及其二级评论。脚本使用requests库发送HTTP请求,通过构建不同URL(first_url获取一级评论,second_url获取二级评论)来爬取数据。支持自定义请求头,包含视频ID数据集处理,实现评论内容提取、性别信息获取和层级评论关联。提供数据保存功能,可选择CSV或JSON格式输出,并对二级评论列表进行适当处理。脚本包含错误处理和请求频率控制,适用于批量获取B站视频评论数据的研究需求。
2025-11-02 14:57:01
119
原创 使用Transform进行文本翻译任务时配置相应的环境
本文介绍了如何搭建适合大模型开发的环境配置流程:1)下载Python 3.8.10版本;2)更新pip至24.0版本;3)根据CUDA版本安装匹配的PyTorch(含版本选择技巧);4)以管理员身份通过指定命令安装fairseq库(解决常见安装问题)。重点提示了软件版本兼容性的重要性,并提供了PyTorch历史版本查询地址。整个流程使用PyCharm作为开发工具,包含详细的命令行操作指引。
2025-10-21 18:21:39
419
原创 Python,Socket实现 多个客户端通过服务端进行通信,项目开源!源码如下!
本文介绍了使用Python Socket模块实现多客户端实时通信系统的方案。系统采用C/S架构,服务端通过多线程处理并发连接,使用JSON格式进行数据交换。关键技术包括:Socket编程基础(TCP协议)、多线程处理收发消息、JSON数据序列化。服务端代码实现了连接管理、消息转发和异常处理;客户端代码包含连接建立、消息发送和接收功能。该系统适用于类似聊天室的实时通信场景,支持多个客户端通过服务端中转消息。
2025-09-09 01:41:40
454
原创 Ollama+LangChain构建本地知识库-----项目实战开始 项目开源!源码如下!
本文介绍了如何使用本地部署的大模型(qwen3)构建个人知识库。首先确保已通过ollama部署本地模型并准备知识库文件。项目结构包括文档目录、配置文件和主程序入口。通过安装langchain等库实现功能,使用Chroma存储向量数据。核心代码包含配置管理、文档加载与分割、对话链创建等功能。系统支持多格式文档处理,具有token计数和对话历史管理能力。运行后生成本地数据库,使AI能基于用户提供的内容进行问答。该方法实现了简易的本地知识库构建,为个性化AI应用提供了基础方案。
2025-07-26 15:08:46
1037
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1