自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 PPO GRPO GSPO DAPO的Loss计算与代码实现

首先看一下KL的基础公式。

2025-10-21 14:44:53 528

原创 AIReview 实战:用 AI 把代码评审提质提速

AI 不是“取代评审人”,而是“放大评审人”的判断力与影响力。把重复机械的工作交给机器,把有限的时间留给需要经验与共识的部分。欢迎试用 AIReview,并把你们团队的实践分享回来,一起把“AI 时代的代码评审”做得更好。源码与问题反馈:仓库与 Discussions)许可证:MIT(见根目录LICENSE如果这篇文章或项目对你有帮助,别忘了给仓库点个 Star~

2025-10-21 14:43:23 362

原创 案例分析:MySQL 并行复制竟然比单线程慢?

最近碰到一个 case,发现在特定场景下,并行复制竟然比单线程复制要慢。

2025-10-21 14:22:37 325

原创 使用 Github Pages 和 Hexo 搭建博客

其实可以通过github.io搭建wiki或者个人博客我挺久之前就知道,不过一直没用,主要是因为已经有一个博客了,没必要再搭一个,不过最近兴起,就搭了个这个附属博客,同步更新主博客的文章。截图:下面说一下优缺点,主要对比的是购买服务器搭建个人博客。

2025-10-21 08:40:36 341

原创 遗传算法入门

通过背包问题,可以看到遗传算法如何聪明地探索所有可能的组合:它不会盲目地尝试所有2525=32种可能。而是通过保留高价方案(选择)、组合不同方案的优点(交叉)、以及偶尔尝试新选择(变异),像搭积木一样,一步步地“进化”出接近最优的装包方案。

2025-10-21 01:44:51 1748

原创 从18w到1600w播放量,我的一点思考。

首先,我思考了一下:数据为什么是这样的?我观察了一下,"微服务"排名前四的都是培训机构上传的系统课程。培训机构嘛,大家也知道,这一类课程的主要目的就一个:赶紧上手。底层逻辑是为“尽快找到工作”而服务。本质上是将一个人在最短时间内打造成能满足企业初级编码岗位要求的合格“牛马”。在这个标准下,一切不能直接、快速为初级编码岗位服务的知识,都会是“冗余”的。所以,你看他们的课程:比如讲到 Eureka 的时候,基本上都是在讲怎么使用,代码应该怎么去写,写完之后怎么跑起来。

2025-10-20 23:03:54 769

原创 PHP 程序员为什么总是瞧不起 PHP ?

其次是 PHP 的入门及其简单,互联网上到处都流传着 《PHP语言7天从入门到精通》的教程,稍微懂点语法就开始上项目,哪有什么设计模式、算法之类的东西,我见过连冒泡排序算法,都不知道的 PHP 程序员也不在少数,但是他们幸运的是赶在了互联网的浪潮上,肝出了很多惊天动地大项目。说到这里,我想举个例子,同样的一个需求 PHP 一天就肝完了,如果用 Java 可能要肝上个三五天,光是编译个程序打个包就要个半天了,还吃内存的要死,哪像 PHP 肝完就直接上线运行,这效率杠杠的,老板和小姨子都欢喜。

2025-10-20 01:37:50 675

原创 AWS EKS部署Prometheus和Grafana

如果EBS CSI组件没有附加对应的IAM role,需要在IAM 控制台中创建附权限且类型为AWS账号的role,否则EKS创建PVC时会报错。为了可以把Prometheus数据写入到AWS managed Prometheus,需要先在AWS Prometheus控制台中创建工作区。替换为集群的名称,并将 <my_prometheus_namespace> 替换为您的 Prometheus 命名空间。中的配置保存为prometheus.yaml,后面会在安装prometheus时使用。

2025-10-19 13:19:56 1323

原创 大模型基础补全计划(五)---seq2seq实例与测试(编码器、解码器架构)

然后训练过程的核心就是:从数据集中获取 训练数据、验证数据,通过训练数据得到预测数据,预测数据和验证数据进行loss计算,然后进行反向传播,找到loss最小化的方向,然后最小化loss,模型就会越来越好。然后就是介绍预测部分的内容:先将原文输入到seq的encoder,然后将bos序列 + seq的encoder的隐藏态传给seq的decoder,就可以得到下一个字的输出,直到我们遇到eos,预测结束。最后,我们开始训练过程,注意,下面的例子是先进行训练,然后保存pt模型,然后加载模型进行预测推理。

2025-10-19 13:18:26 1787

原创 奶奶都能看懂的 C++ —— const 限定符与指针

试试这样想吧:const 就是一种修饰。指针是瓶子的标签,你可以让瓶子(对象)本身不可变(顶层 const 修饰),但这样你必须在标签(指针)上写上“别动瓶子”(底层 const 修饰)。如果你看到了“别动”的标签(底层 const 修饰的指针),想根据这个标签给瓶子再贴一个标签,或者把别的瓶子上的标签移过来(创建新指针/修改旧指针),那么另一个标签上也得写“别动”(底层 const 修饰)。

2025-10-19 10:46:11 398

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除