缺的不是资料，是学习的心-CSDN博客

原创 claudecode Note: Claude Code might not be available in your country. Check supported

在 Mac 或 Windows 终端/命令行中输入 claude 命令后，出现以下错误提示，无法正常使用 Claude 服务：Unable to connect to Anthropic servicesFailed to connect to api.anthropic.com: ECONNREFUSEDPlease check your internet connection and network settings.Note: Claude Code might not be available i

2026-02-19 18:55:38 1918

原创 claude-code自定义

安装Claude-code配置url和token。

2026-01-31 22:18:58 329

原创大模型自一致性

大模型自一致性是指通过设计多个不同角度的提问方式(prompt)，让大模型生成多组答案，然后采用投票机制选择出现频率最高的答案作为最终结果。这种方法类似"少数服从多数"的决策原则，能提高回答的可靠性，减少模型输出的随机性错误。

2025-12-31 01:20:44 411

原创 vmware虚拟机ens33拿不到ip,已经开启dhcp了

摘要在CentOS虚拟机迁移过程中，直接复制VMX文件会导致网络适配器MAC地址冲突。解决方法是在VMware中为新虚拟机生成新的MAC地址：选中虚拟机→设置→网络适配器→高级→MAC地址，点击"生成"按钮获取新地址。这样就能通过DHCP重新获取IP地址，解决ens33网卡无法获取IP的问题。该方法适用于虚拟机克隆或迁移时的网络配置问题。

2025-12-21 22:19:28 242

原创 ms-swift训练的感悟2

query: apos：[A]neg:[B,C]1x(2+1) =3 //待入官方公式，对上了因为他最后都是point2point的，可以看出来输入一个query和多个docs 请求reranker的时候还是通过推理 query-doc 来解决的至于listwise ，也只是拿到point2point的loss后再编排而已，怎么编排让point2point的效果更好。

2025-12-06 19:41:39 966

原创使用ms-swift的一些感悟

传统 Reranker- 最基本的方法，适用于一般的排序任务- 利用生成能力，更适合复杂语义理解- 优化整个排序列表，提升整体排序质量- 结合前两者优势，提供最佳性能在实际应用中，可以根据数据特点和性能要求选择合适的训练方法。

2025-11-27 02:40:41 302 1

原创春暖花开，夏日炎炎

遇到搞心态的同事和团队，还是算逑了吧，这钱不是我该赚的hh。

2025-11-17 23:41:24 148 1

原创沙雕操作之删除了pnpm.lock文件

摘要：手欠删除pnpm.lock文件导致TS项目安装异常，排查半天无果，堪称最狗血开发事故。

2025-11-05 19:35:18 114

原创阿里云docker删镜像失败

安装了两个docker,删除其中一个docker就行。即使是root都还是报权限不足。

2025-10-25 00:15:44 281

原创 mongoschema定义错误，

这篇文章解释了在Mongoose Schema中使用枚举类型时的一个常见问题。当使用Object.values(CalculateMethodEnum)作为枚举值时，由于TypeScript枚举会同时包含数值和字符串键，导致输出数组混合了数值和字符串值[0, 1, "mean", "median"]，这与Schema中定义的Number类型冲突。正确的做法是使用单独定义的枚举值数组CaculateMethodValues，而不是直接使用Object.values()。

2025-09-04 21:32:58 138

原创 docker回炉重造

知识点1：这个地方域名fastgpt-minio能够访问，是因为docker compose会为每个服务名启动一个DNS,最近在学习fastgpt项目，其中使用docker compose启服务。docker compose文件。如果想改变依赖的镜像源。

2025-08-19 20:33:08 301 1

原创 github下载项目提速

添加完上面配置之后，需要在新窗口重新写git clone，旧窗口可能配置还没生效。使用了v2rayn之后，下载git仓库还是很慢？

2025-08-18 11:24:57 403

原创 mock-pytest测试

想mock触发sqlchemy的异常。

2025-07-04 20:11:14 189

原创你领导给你开通了root权限，但是你不会用？

摘要：sudo su用于将当前用户权限提升至超级用户，无需root密码。适用于管理员授予普通用户sudo权限但不提供root账户的情况。执行sudo su时只需输入当前用户密码，即可获得root权限，解决了普通用户频繁使用sudo前缀的问题，同时保障系统安全（领导无需分享root密码）。该命令在管理员信任用户但需限制root直接访问的场景中尤为实用。

2025-06-28 01:43:20 118

原创 milvus实操踩坑

将脚本下载下来，只要docker run那部分。attu看不到没有创建索引的数据。

2025-06-24 15:43:28 149

原创三十年河东，三十年河西

重新出发了，后端->大模型微调->AIGC。最怕自己能力不足，还在自我安慰。顶峰相见了，以后没得🐟摸了。你需要补不足，补短板。

2025-06-17 00:18:32 154

原创 milvus

https://milvus.io/docs/zh/install_standalone-docker.md

2025-06-16 23:50:09 277

原创一个好用的快速学习的网站

Thetawave.ai 是一个创新的工具，支持将视频链接快速转换为笔记，特别适合时间有限的用户。通过该平台，用户可以轻松总结B站等平台的教学视频内容，提高学习效率。每天提供免费使用额度，方便用户无需额外成本即可体验其功能。访问链接 https://thetawave.ai/auth/signup?ref=ALCNQZ 注册使用，立即体验这一便捷的学习辅助工具。

2025-05-10 14:48:57 6698

原创图数据库榜单网站

图数据库榜单。

2025-04-30 16:34:09 284

原创【无标题】

model_args.compute_dtype (比如设置为 torch.bfloat16 或 torch.float16) 控制了模型的计算精度，包括前向传播、损失计算等，梯度等。对于优化器的精度，通常不直接受到影响。优化器（如 Adam、AdamW）的参数更新依然使用 float32 精度。

2025-04-28 02:02:59 259

原创 lora训练超参

【代码】lora训练超参。

2025-04-10 17:31:28 159

原创 qwen推理示例代码

huggingface推理qwen2.5-0.5B对话推理代码。

2025-04-08 15:00:47 266

原创 embedding做HDBSCAN

【代码】embedding做HDBSCAN。

2025-04-08 11:44:20 363 1

原创轮廓系数做聚类，枚举

best_k = kprint(f"最佳 k = {best_k}, 得分 = {best_score:.4f}")

2025-04-08 10:27:49 406

原创【无标题】

使用llm训练embedding的时候，要在query后面接上一样的<|endoftext|>

2025-04-01 17:52:32 162

原创 bge M3做融合检索

【代码】bge M3做融合检索。

2025-03-28 11:43:19 454

原创 vllm并发太大，导致服务奔溃

GPU KV-cache usage: 接近100%的话就会导致推理失败，注意 KV-cache usage不能过高。Prefix cache usage: 加速推理的，为了尽可能命中前缀缓存，应该尽量将公共的输入部分前置。

2025-03-26 10:19:51 1020 1

原创牛客读取入参

nextByte()、nextShort()、nextLong()：读取其他数值类型。hasNextDouble()：检查下一个输入项是否为浮点数。nextLine()：读取整行（包括空格，直到换行符）。hasNextInt()：检查下一个输入项是否为整数。next()：读取下一个单词（以空白字符为分隔符）。hasNextLine()：检查是否还有下一行。hasNext()：检查是否还有下一个输入项。nextDouble()：读取下一个浮点数。nextInt()：读取下一个整数。

2025-03-25 21:30:34 192

原创【无标题】

遇到这个报错，可以直接卸载 sphinx。

2025-03-25 09:24:35 162

原创 python开发返回数据格式变元组了，排查半天

可以观察到元组最后以,结尾，很有代表性的错误。返回数据后面带,逗号。

2025-03-21 09:06:06 348

原创跑批限制时间工具

【代码】跑批限制时间工具。

2025-03-07 20:42:48 170

原创 autodl运行模型报错

autodl V100 运行HuaTuo-o1,报错。报错了，是因为gpu资源，改用半精度就解决了。

2025-01-23 17:13:59 1432 2

原创使用qwen作为基座训练分类大模型

训练大模型注意这个必须加上，不加上batch_size>1会报错。

2025-01-23 17:00:04 960

原创 autodl下载huggingface模型使用镜像加速

model-00004-of-00004.safetensors 是你要下载的文件，灵活变动，参考下图内容。FreedomIntelligence/HuatuoGPT-o1-7B 这部分参考下图红框框的内容灵活变动。

2025-01-22 10:38:27 661

原创 jupyter环境使用问题

剪切jupyter文件，打印当前路径还是显示旧的文件夹路径。解决方案使用拷贝，不用剪切。

2024-12-17 17:15:34 149

原创 faiss数据库检索不稳定

faiss数据检索不稳定这个代码不稳定，构建的索引召回结果可能会不稳定，需要。

2024-12-13 15:56:31 362

原创 pandas操作

不可变对象（如整数、浮点数、字符串、元组等）：由于不可变对象无法修改，函数内部对该对象的任何操作都会创建一个新的对象，原始对象不受影响。传递的是对象的引用：当你将一个变量作为参数传递给函数时，实际上传递的是该变量所指向的对象的引用，而不是对象本身或其副本。可变对象（如列表、字典、集合等）：函数内部对对象的修改会直接影响原始对象，因为它们共享同一个引用。

2024-12-11 11:55:11 244

原创 csv文件处理多个字段拼接到同一个字段错误

这种有问题，df[‘b’]或df[‘c’] 其中有一个取值为nan最后得到的结果就是nan，这种明显不符合要求。df[‘a’] = df[‘b’] + ‘字段c’ + df[‘c’]

2024-12-10 16:12:42 165

原创当别人没用用json.dumps保存对象数据的时候，该怎么重新将这些字符串识别为对象

当别人没用用json.dumps保存对象数据的时候，该怎么重新将这些字符串识别为对象。可以使用 ast 参考代码如下。

2024-12-04 11:49:10 146

原创工作感悟241127

当某个想法开始出现的时候，就很难纠正自己。如果再在那里犹犹豫豫，就是在浪费时间hh。

2024-11-27 09:03:33 166

Java后端代码生成器，减少造轮子

空空如也