自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

转载 后缀自动机(SAM)

SAM 几乎可以算是信息竞赛中字符串的终极解决方案。几乎所有的比较难的字符串题都可以通过 SAM 的性质结构之类的东西延伸出来。事实上,更准确的说 SAM 更像数据结构,是一种与 tire 树类似的东西。其结构是一张 DAG 与 一棵树的和,这二者的点集都是一样的。DAG 上的边与 trie 上的类似,都是表示一个字母。通过走 DAG 上的边,我们可以表示这个字符串的所有子串,通过走 parent 树上的边,我们可以表示所有当前节点表示的子串的所有后缀。

2025-05-28 02:51:10 47

转载 大模型 Token 究竟是啥:图解大模型Token

前几天,一个朋友问我:“中的究竟是什么?这确实是一个很有代表性的问题。许多人听说过 Token 这个概念,但未必真正理解它的作用和意义。思考之后,我决定写篇文章,详细解释这个话题。我说:像和这样的超大语言模型,都有一个“刀法精湛”的小弟——Tokenizer。当接。会让把它。这切出来的每一个小块就叫做一个。比如这段话(),在大模型里可能会被切成这个样子。像,可能是一个。构成的,也可能是一个。构成的,也可能是一个。,也可能是一个。,或者是组成的一个,也可能是一个。

2025-05-02 12:38:10 58

转载 级联数据获取方案

背景,分布式系统中,我们需要数据级联,很多时候拿到的是userId或者List,然后返回给前端展示的时候需要id对应的一些其他信息比如昵称。为啥我们只有id,没有直接查询出来这些信息呢?可能是表关联太多,性能低。也可能是对应的数据在另外的服务上面,没法用表关联。首先说一句,通过id 轮询查询 附加信息是被禁用的,效率太低。...

2024-08-22 04:09:02 106

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除