- 博客(14)
- 收藏
- 关注
原创 常用大模型平台 + 完整下载方法 + 国内稳定方案
当前开源大模型生态已形成的格局。国际上以为绝对核心,汇聚了全球最丰富的 LLM、多模态、语音与计算机视觉模型,是科研与工程开发的首选平台,但国内直连存在速度与稳定性问题。为此,作为全量同步的公益镜像,实现了国内高速访问 Hugging Face 资源,成为国内开发者的重要基础设施。国内方面,依托阿里生态提供高速直连服务,模型库全面、下载工具成熟,支持断点续传与单线程防风控下载,是国内大模型本地化部署的最优选择。对于轻量化使用场景,
2026-03-30 14:34:46
630
原创 Tokenization分词
🔴 分词(Tokenization):将文本拆分为最小语义单元(token,如单词、子词、字符);🔴 编码(Encoding):将每个 token 映射为唯一的整数 ID;🔴 解码(Decoding):将整数 ID 还原为文本(逆向操作)。展示分词可视化结果的网站分词粒度定义示例(文本:"Hello, world!")适用模型重点特点字符级(Character)按单个字符拆分"]小模型、低资源语言粒度最细,词汇表小,但语义信息少单词级(Word)按空格 / 标点拆分单词"]
2026-03-17 21:35:25
377
原创 python常用库的学习
可以把ray理解为Python 的多进程 / 多线程升级版,只需调用简单的 API(如ds.map),就能自动实现多进程 / 多节点并行处理数据,还支持分布式部署(多台机器)补充:dt 是Pandas 中日期时间类型(datetime64)Series 的专属访问器(accessor),核心作用是:快速提取日期 / 时间的具体属性(如年、月、日、时、分、秒)或执行时间相关操作。的一维数组,可存任意数据类型(int/float/str/ 对象),由「索引(index)」和「值(values)」两部分组成。
2026-03-16 22:24:39
431
原创 python配置文件YAML详解(含示例)
YAML 是 Python 项目中最常用的配置文件格式,所有参数集中定义在 YAML 里。YAML 以为基础,通过缩进实现嵌套,支持列表、字典、锚点复用。Python 文件通过读取 YAML 文件解析出参数字典,再在代码中调用这些参数。
2026-03-15 16:42:40
329
原创 bug修复:lementedError: Using RTX 4000 series doesn‘t support faster communication broadband via P2P or
报错:NotImplementedError: Using RTX 4000 series doesn't support faster communication broadband via P2P or IB. Please set `NCCL_P2P_DISABLE="1"` and `NCCL_IB_DISABLE="1" or use `accelerate launch` which will do this automatically.方法三:用 accelerate 启动(推荐多卡训练)
2026-01-14 21:30:28
83
原创 3588开发板大模型apk开发
硬件:Windows11电脑+Linux服务器+3588Android12开发板软件:vscode+Android studio+adb。
2025-12-15 21:32:39
764
原创 在VScode中修改python调用模型的存储位置,谨防C盘爆炸
Hugging Face 是一家人工智能公司,其构建的模型库(Hugging Face Models)是全球最大的开源AI模型社区之一,包含了数以万计的预训练模型开发者可以直接下载、使用或微调这些模型,快速实现各种AI任务。Hugging Face模型缓存路径一般默认在C盘,修改路径到其他盘,以避免默认路径占用过多空间,同时便于模型管理。
2025-10-09 18:02:18
375
原创 MongoDB新版安装以及解决浏览器无法访问localhost:27017的问题
部分安装教程对应的是旧版MongoDB,新版仅仅需要在官网下载包后,按照安装引导即可,(可以直接勾选compass,安装速度很快),按照bilibili或者其他各大平台旧版教程安装新版大概率会出各种问题。方案一:替代方案:使用MongoDB ComPass,直观管理数据库,无需依赖浏览器访问27017端口。在任务管理器中查看进程ID7292对应的是MongoDB进程,表明端口占用正常。:打开cmd命令行(管理员身份运行),执行命令。提示服务已启动,说明MongoDB服务运行正常。在命令行中输入以下内容。
2025-09-25 10:27:16
680
原创 zetero文献管理工具安装与使用
下载完成后,回到zetero软件,点击tools工具,选择plugin插件,将刚刚下载的插件直接拖进来,拖进去后会弹窗提示安装好插件,点击done,并叉掉下一个弹窗,安装成功。下载插件jasminum,下载后点击编辑---设置--茉莉花--更新到最新,在edge浏览器,右键点击zetero扩展--管理扩展--扩展选项--高级--点击translator的重置按钮。1.在edit-----setting-----general-------language部分可将语言改为中文简体。1.登录zetero官网。
2025-09-04 11:46:42
1464
原创 微博内容爬虫程序
本文介绍了一个微博爬虫程序的实现方法。该程序通过开发者工具获取微博cookie后,可抓取指定时间范围内包含关键词的微博内容及评论数据。程序主要功能包括:1)通过开发者模式获取cookie填入代码;2)设置关键词和时间范围进行数据爬取;3)提取微博正文、发布时间、转发评论点赞数等信息;4)可选抓取微博评论;5)将结果保存为CSV文件。程序使用Python编写,依赖requests、BeautifulSoup等库,实现了微博数据的自动化采集与存储。使用前需注意微博的反爬机制,并合理设置爬取间隔时间。
2025-07-25 13:15:28
1277
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅