- 博客(4520)
- 资源 (31)
- 收藏
- 关注
原创 假设性推演: 从“失去”的视角看,你会懂得珍惜; 从“得到”的视角看,你会学会释然。
通过"假设性推演"思维方法,从两个视角重新审视生活:一是假设失去现有的一切,会发现健康、亲情等基础要素才是真正的珍宝;二是假设实现所有梦想,会明白任何成就都不会带来永恒的满足。这种思维实验不是消极的自我安慰,而是校准人生坐标的有效工具,帮助区分真正重要与无关紧要的事物。推演让我们既珍惜当下拥有,又不盲目追逐虚幻目标,在进取与知足间找到平衡,做出更清醒的人生选择。(147字)
2026-06-14 15:31:40
152
1
原创 跟谁过不得生孩子:说出方 本质拉低你的议价权,看低你的付出,但是更底层的逻辑是 她是在谈买卖,不是爱情
跟谁过都要生孩子;和谁结婚都要买;和谁谈恋爱都要花 的底层逻辑是掌握议价权:这句看似公道的话,藏着最鸡贼的逻辑陷阱这里先说了女性视角,因为我是男的,认为女性还是相对弱势的,因此不应该攻击女性;# 这里底层逻辑就是 说出方 本质拉低你的议价权,看低你的付出,但是更底层的逻辑是 她是在谈买卖,不是爱情
2026-06-14 15:14:47
418
1
原创 极简决策法
这个世界很复杂,人心也很复杂。但我们的决策逻辑,可以很简单。下次当你再遇到让你生气、焦虑、纠结的事情时,不妨停下来,按照这四个步骤问自己一遍。你会发现,原来很多事情,真的没什么大不了的。
2026-06-09 12:12:24
365
原创 “这是好事啊“:“经历过才能从容“是成长的唯一路径?
人生就是一个不断面对新压力、不断克服新挑战的过程。没有谁能够提前学会所有的应对技巧,也没有谁能够永远活在舒适区里。所以,不必为现在的压力而难受。因为每一次压力,都是一次成长的机会;每一次痛苦,都是一次蜕变的契机。当你下次再感到压力山大时,不妨深吸一口气,然后笑着对自己说:**"这是好事啊。"**
2026-06-04 23:45:32
170
原创 怎么做决策:换位思考;做树状脉络分析利弊(重在思考失去下限,不要不珍惜现在),拉长时间线
1. **不要追求完美决策**:世界上没有完美的决策,只有"足够好"的决策。过度追求完美会导致"分析瘫痪"。2. **小步快跑,快速迭代**:对于不确定的决策,不要一次性投入全部资源,而是用小的试错来获取反馈,然后根据反馈调整。3. **相信过程,而不是结果**:长期来看,好的决策过程一定会带来好的结果。不要被短期的运气所迷惑。
2026-06-03 23:53:53
376
原创 不说丧气的话(我不是必须上班,为啥挣钱赎身):你越是关注美好的事物,大脑就越擅长发现美好的事物
改变不是一蹴而就的。你已经用了几十年的时间来塑造你现在的神经回路和认知模式,不可能在一天之内就把它们完全改变。你会有反复,会有倒退,会有很多时候觉得自己又回到了原点。这很正常,不要因此而自责。每一次你觉察到自己在压抑,每一次你选择用不同的视角看待问题,每一次你把注意力拉回到当下,都是一次小小的胜利。这些小小的胜利积累起来,终有一天会变成巨大的改变。记住:**人生不是一场等待痛苦结束的旅程,而是一场在痛苦中依然选择享受的旅程**。你不需要等到一切都完美了才开始享受人生,你现在就可以开始。
2026-06-02 17:58:54
305
原创 工单数据分层序列化:全量保留+高效处理方案
本文提出了一种针对大规模工单数据的"分层序列化框架",通过结构化分层处理将12万条工单压缩至4-6万tokens(压缩比15:1),同时保留完整可回溯性。该方案包含五层架构:元数据层(100tokens)描述数据结构、全局统计层(500tokens)展示关键指标、聚类摘要层(3万tokens)通过语义聚类提炼问题类型、典型样本层(1万tokens)保留原始案例、索引层(5000tokens)实现全量数据回溯。相比传统序列化方法,该框架使大模型能先快速获取全局洞察,再按需深入细节,有效解决了上下文窗口限制与数
2026-05-19 00:30:24
441
原创 中国人口断崖式下跌:城市化必然带来社会原子化,市场化必然催生个人主义与消费主义;我们走向养老医疗、AI机器人、高端制造、高端服务业。
从全球范围看,所有完成现代化、城市化的国家,都无一例外经历了生育率的断崖式下跌,这是社会发展的必然规律。现代化必然推高劳动力再生产的成本,城市化必然带来社会原子化,市场化必然催生个人主义与消费主义,这些都会从根本上瓦解传统生育的经济基础与意义体系。中国的特殊性在于,我们用40年走完了西方国家200年的现代化进程,所有的矛盾与压力集中爆发,导致人口下跌的速度更快、幅度更大,对社会的冲击也更剧烈。
2026-05-08 15:12:38
126
原创 未来AI 风口是什么: 端侧AI移动产品 (先做原生用户,再做研究者)
把你的研究成果做成开源项目,比如端侧轻量化模型、端侧Agent框架,对接Llama Mobile、GLM等成熟开源生态,既可以获得全球开发者的反馈,持续优化研究,又能快速打造你的行业影响力,不管是后续进高校、进企业核心实验室,还是创业,都有极强的议价权。
2026-05-05 16:33:32
486
原创 AI原生时代-入场法则:体验-缺点-优化
AI大模型这个核心风口赛道,有天然的专业优势,完全不用追和专业无关的风口。对你来说,最优路径是:1. 先深度体验「端侧AI、Agentic AI、具身智能」这三个和你专业高度绑定的风口,成为重度原生用户;2. 从你的科研和日常使用中,找到真痛点、真缺点,用你的LLM专业能力解决这些痛点;3. 先从开源项目、学术创新、小工具开发切入,成为浪潮的参与者,逐步放大,最终把专业能力变成风口里的核心竞争力,真正实现“爱一行干好一行”。
2026-05-05 11:33:01
417
原创 这是好事啊- 精神:第一时间跳出情绪的陷阱
那些你以为的天塌下来的灾难,回头看,其实都是你人生的转折点;那些你以为跨不过去的坎,回头看,其实都是让你跳得更高的跳板;那些你以为的倒霉和不幸,回头看,其实都是命运给你最好的礼物。真正的强大,从来不是一辈子顺风顺水,从来不是不会遇到坏事。而是无论命运扔给你什么烂牌,你都能笑着说一句:“这是好事啊”,然后把它打成一副王炸。
2026-05-05 00:00:32
263
原创 未来M2的新支柱:绿色能源;硬科技高端制造;银发经济与养老医疗健康;数字经济与新基建(算力网络、AI、数据中心
未来中国经济增长模式将发生根本性转变,房地产不再作为M2的核心锚点,取而代之的是"1+4"产业集群体系:以绿色能源全产业链为主引擎,科技金融与高端制造、新型城镇化、银发经济、数字经济为四大支柱。这一体系将在信用派生、产业链拉动、财政支撑等方面全面替代房地产功能,形成更可持续的经济增长新范式。其中,新能源产业凭借20%以上的年增速、8万亿投资规模和全球竞争力优势,将成为最重要的信用创造载体。转型将分三阶段推进,通过政策引导和金融创新,最终实现经济结构优化和货币创造机制的重构。
2026-05-03 20:11:12
68
原创 我怎么更加靠近M2
坎蒂隆效应解析:货币传导中的财富分配密码 坎蒂隆效应揭示了货币非中性本质,指出新增货币的传导存在层级差异,形成财富再分配。现代信用货币体系下,这一效应被显著放大: 传导机制:货币从银行信贷端定向投放,最早接触资金的群体(大型企业/机构)能在物价上涨前配置资产,而末端接收者(普通工薪层)则面临贬值后的购买力。 现实表现: 疫情放水周期中,头部企业率先获得低息贷款抄底资产 LLM赛道里,头部AI公司最早获得专项融资垄断资源 普通从业者最后接触资金时,核心资源价格已高涨 破局路径: 绑定政策资金通道(科研项目/人
2026-05-03 19:38:00
56
原创 北上广深:人口集聚+产业集群+城镇化=资产增值+信用扩张;偏远地区:公共品供给+主权安全兜底=集团永续经营的前提
我们总说,时代的一粒灰,落在个人头上,就是一座山。但反过来,时代的一滴水,流对了地方,就能汇成一片海。把中国看成一家超大型集团公司,你就会发现,所有的区域分化、财富差距、人生选择,本质上都是对这家集团底层运行逻辑的适配度。转移支付不是总部的扶贫施舍,是为国家底线功能支付的战略采购款;M2增长不是洪水猛兽,是信用货币时代的时代列车;县城的繁华不是凭空而来,是国家战略布局下的资金循环结果;大城市的内卷不是无解的困局,是增量创造游戏里必经的价值筛选。我们把这套逻辑说透,从来不是为了制造地域优越感,不是
2026-05-03 19:30:38
598
原创 用大城市的增量思维在县城混,不行;用县城的存量逻辑在大城市闯,也不行;大城市里源源不断的低成本劳动力,是乡村家庭养育长大
没有绝对的好坏之分,只有适配不适配。你选择去哪里发展,核心标准从来不是哪里更繁华、哪里更安逸,而是你能不能看懂、能不能适配当地的游戏规则。用大城市的增量思维在县城混,只会处处碰壁;用县城的存量逻辑在大城市闯,也注定走不远。看懂了这套底层逻辑,你再看县城的湿地公园、街头的豪车、热闹的麻将馆,就不会再有困惑了。
2026-05-03 19:03:29
408
原创 豆包API实现精准网页检索:web_search的实现流程-意图识别-信息获取-知识融合-事实校验」的Agent闭环
很多人一直在问:大模型从「能说会道」到「能做实事」,到底差了什么?答案就是工具调用。静态的训练数据,永远赶不上动态变化的真实世界;闭源的模型记忆,永远覆盖不了无限的长尾需求。而web_search这类原生工具,本质是给大模型打开了一扇通往真实世界的门,让它不再是一个被困在训练数据里的「语言模型」,而是一个可以主动获取信息、自主完成任务、解决真实问题的「智能体」。你以为加的是一行搜索配置,实际上,你给模型装上了感知真实世界的眼睛,打通了从「语言生成」到「事实落地」的最后一公里。而这,就是大模型
2026-05-03 10:31:16
751
原创 LLM Agent 怎么实现网页检索功能之后再进行LLM 回答
本文介绍了实现LLM Agent网页检索功能的解决方案。遇到的主要问题包括类型错误、配置错误和模块缺失,通过安装volcengine SDK解决。文章展示了最终实现效果截图,并提供了完整的Python代码示例,演示如何调用Volcano Engine的API接口进行网页检索和LLM回答。代码包含API密钥设置、请求头配置、JSON数据构造,以及异常处理和响应解析逻辑。该实现支持通过web_search工具进行关键词检索,并提取LLM生成的文本回答内容。
2026-05-03 01:18:28
206
原创 大模型技能与智能体的核心区别 以及 技能和Agent误区澄清
摘要: 大模型中的SKILL与Agent存在本质区别。SKILL是原子化的执行单元,仅能按固定参数完成单一任务,缺乏自主决策能力(如CSV分析工具)。而Agent是智能调度中枢,具备目标拆解、工具调度、异常处理等全闭环决策能力,能处理模糊需求并整合多步结果(如数据分析客服)。两者的核心差异在于:SKILL聚焦“如何执行”,需完整输入且无上下文记忆;Agent专注“何时/如何调度”,支持自然语言交互与多轮迭代。实际应用中,固定任务用SKILL即可,复杂动态场景需依赖Agent协调多个SKILL完成闭环。 关键
2026-05-02 17:08:38
121
原创 《全球视野下的投资机会》:稀缺性是投资的核心;所有货币体系,本质上都是用虚构的叙事构建的信用共识;AI时代,没有绝对稳定的工作
时寒冰在《全球视野下的投资机会》中指出,AI革命颠覆了传统稀缺性定义,重构全球格局与财富逻辑。核心变化包括:劳动力成本套利失效、标准化职业被替代、追赶窗口关闭、投资逻辑转向不可复制的稀缺资源(如能源、核心城市房产),以及货币体系动荡引发的滞胀风险。 普通人应聚焦四大方向: 不可替代能力:精准指令、跨领域整合、人性洞察与创造力; 刚性稀缺资源:能源、粮食、核心区位不动产; 垂直AI解决方案:结合行业经验与AI工具的落地服务; 反脆弱资产:黄金与多元化现金流。 行动指南:快速掌握AI工具,转型至“AI赋
2026-05-02 09:59:20
530
原创 送礼:挑性价比极低、送心意、送记忆点; 保留30%的神秘感:距离产生美,也产生敬畏
我们这一生,说到底,就是一场不断修行、不断成长的旅程。这些生存法则,从来不是教你变得圆滑、变得世故,而是让你看清这个世界的真相后,依然能保护好自己,依然能从容、笃定地往前走。不用羡慕别人的顺风顺水,那些看起来走得很稳的人,不过是比你更早懂了这些底层逻辑,踩过的坑、悟透的道理,都变成了自己的铠甲。愿我们都能,有不伤人的教养,也有不被人伤的气场;有向前走的野心,也有稳得住的底气;懂人情世故,却依然内心赤诚,在这复杂的世界里,活得清醒、通透、自在。
2026-05-02 00:41:23
303
原创 该怎么做决策:时间穿越;是否有利;先算「下限」,再看「上限」
四步决策法,帮助人们摆脱选择困境:1.双向思考,列出「做与不做」的后果;2.评估必要性,过滤非必需选项;3.优先计算最坏结果(下限)而非最好结果(上限);4.用时间穿越法消除短期情绪干扰。核心在于:成年人的清醒决策不是追求完美答案,而是选择能为自己兜底、不后悔的选项。通过系统评估代价与收益,避免被欲望、焦虑和跟风绑架,实现真正为自己负责的选择。
2026-05-01 23:33:12
230
原创 每一次科技的重大变化和政策的重大变化都是一次财富重新分配的机会,有变化就会有需求,你能满足需求就能获得利润
1. **AI替代的是「环节」,从来不是「人」**:所有被批量替代的,都是「规则明确、重复性高、无需复杂决策与情感共鸣」的执行环节;而「提出问题、定义需求、核心决策、创造新价值、深度情感链接」的能力,永远无法被AI替代。2. **AI冲击的是「旧壁垒与旧模式」,从来不是「行业本身」**:AI打碎的是稳态市场中头部玩家垄断的经验壁垒、信息壁垒、规模壁垒,给新入局者创造了弯道超车的窗口,反而会让行业向更高效、更创新的方向发展。3. **对于LLM领域从业者,最大的机会永远在「AI重构行业的环节」**:
2026-04-27 01:02:09
544
原创 准则:沉没成本不参与重大决策;承兑附有条件的,视为拒绝承兑;保持怀疑,独立性高于一切
摘要:三条专业准则教你活出通透人生 财会准则揭示:沉没成本不应绑架未来决策。无论感情、职场还是投资,已付出的时间精力都无法收回,唯有放下才能避免更大损失。经济法准则提醒:所有带附加条件的承诺本质都是拒绝,职场画饼和人际敷衍都应按无效处理。审计准则启示:保持独立思考和怀疑精神,不盲从外界标准,才能掌握人生主动权。这三条专业准则分别教会我们放下过去、看清人心和守住自我,是破解人生内耗的钥匙。掌握它们,你就能做出清醒选择,活出通透人生。
2026-04-26 11:31:35
266
原创 很多时候,你赚不到钱,不是你不够勤奋,不是你能力不行,而是你在整个分配链条里,处于最弱势的位置:要么掌握核心的生产资料,要么拥有不可替代的核心技术
文章指出所谓“经济危机”本质是分配危机,贯穿人类历史千年不变。核心观点包括:一、危机从来源于分配不均而非生产不足,古今案例(如大萧条、王朝更替)都显示资源过度集中导致系统崩溃;二、分配失衡根植于人性贪婪和资本增值必然性,形成"富者愈富"的死循环;三、历史呈现分配体系崩塌与重建的周期性,现代调控手段只是暂时缓解;四、普通人要认清劳动在分配链末端的事实,需争取生产资料或核心技术以获得话语权。文章强调技术发展未改变分配本质,文明进步关键在于建立遏制人性贪婪的可持续平衡机制。
2026-03-28 15:50:17
409
原创 投稿《Cluster Computing: The Journal of Networks》(订阅后私信协助投稿:包括模板,cover letter ,论文润色,校稿,等问题)
投稿《Cluster Computing: The Journal of Networks, Software Tools and Applications》技巧、流程及录用 (订阅后私信协助投稿:包括模板,cover letter ,论文润色,校稿,等问题)## 投稿spring 时间线和录用参考## 哪里能查询详细的SCI投稿状态信息(https://www.researchsquare.com/home)
2025-06-17 10:17:47
1269
1
原创 投稿Expert Systems with Applications历时3个月;中科院1区顶刊,有哪些技巧 Editor Assignment Pending 科研配色
有需要投稿模板和返修模板的直接订阅后私信,本人可以协助完成投稿返修;本人在科研一线,在文章架构设计,公式编辑,图片美化,语言润色。overleaf编辑方面有一定经验,直接订阅后私信本人可以协助完成投稿返修
2025-03-13 15:45:52
1568
1
原创 很反感动不动就劝人“要放下”“要看开”的鸡汤:绝大多数的豁达,都不是练出来的心态,而是攒出来的底气
文章摘要:真正的豁达源于底气而非心态训练。当人们过度在意他人评价时,往往是因为自身抗风险能力薄弱,被迫依赖外部认可。对普通人而言,底气就是计算最低生存成本后能支撑无收入生活的时长——3年存款能带来拒绝的勇气,5年可培养说不的硬气,10年则对琐事自然看淡。没有物质基础强求豁达如同在悬崖边练平衡,真正的从容来自经济保障。建议优先积累生存资金而非空谈情绪管理,当账户数字能托底数年生活时,许多烦恼自然变得微不足道。看开的本质不是想通,而是拥有了"无所谓"的资本。(149字)
2026-06-25 21:51:21
3
原创 Adaptive ML:小模型预测给大模型一次验证; 为什么 大的LLM「验证」K 个词只要 1 次前向?
这个网站讲的是**推测解码**:小模型抢跑写草稿,大模型并行验证,**接受大部分、对被拒的词从「残差分布」重采样**(图里 buzz→wiggle 这一步)。它的精髓是 **"Preserving the Distribution"——在提速 2~3 倍的同时,保证输出和单独用大模型完全等价、不掉质量**。论文就是 Google 的 *Fast Inference from Transformers via Speculative Decoding* (Leviathan, 2023) 和 DeepMind
2026-06-25 19:49:19
5
原创 解码机制揭秘:模型如何生成一个回答:束搜索是什么、temperature/top_k/top_p 在哪一步起作用
本文解析了语言模型生成回答时的内部解码机制。关键点包括:1)模型通过自回归逐token生成,每个token需一次前向计算;2)temperature、top_k、top_p参数在每个token生成步骤中依次作用(缩放概率分布→截断候选词→采样);3)束搜索(Beam Search)作为替代方案,通过维护多条候选路径寻找全局最优解,计算量约为普通采样的B(束宽)倍。两类解码策略(随机采样/束搜索)通常二选一,最终都输出单次API调用的结果。核心区别在于束搜索追求确定性最优解,而采样路线通过参数调控生成多样性。
2026-06-25 18:57:53
7
原创 熵与分布(更懂「犹豫」):整个候选分布有多分散; P(True) 自评估:追加一个问题「上述答案是否正确?(A) True (B) False」,再看 logprob;
本文 总结了基于logprob的幻觉抑制创新方案,提出从基础到前沿的四层技术架构: 基础层:单值置信度方案,推荐最小token概率法(Min-Prob),能精准捕获关键实体错误; 熵分析层:引入预测熵和语义熵(Nature 2024创新方案),通过语义聚类区分表达差异与真实不确定性; 采样验证层:通过多次采样交叉验证(如SelfCheckGPT),利用回答一致性判断幻觉; 实时干预层:前沿的FLARE方案动态触发RAG检索,CAD对比解码增强事实性,约束解码物理消灭非法输出。 方案特点:从静态检测升级为生
2026-06-25 17:03:11
7
原创 AI测谎仪:用logprobs揭露大模型的自信度
如何利用大模型的logprobs(对数概率)功能来检测AI生成内容的可靠性,减少幻觉(错误但自信的回答)。logprobs揭示了模型生成每个词时的内部概率,可用于量化模型的不确定性。文章介绍了OpenAI和Gemini接口获取logprobs的方法,并提出了三个实用场景:设置置信度阈值自动转人工、提升分类任务的可信度判断,以及识别幻觉高发点。同时指出logprobs的局限性——无法检测系统性错误知识,建议结合RAG和工具调用构建更完整的防幻觉方案。通过挖掘模型的内部概率数据,开发者可以在黑盒调
2026-06-25 16:39:28
8
原创 揭秘大模型内心戏-幻觉抑制技术:logprobs测谎术
大模型不会主动喊「我不确定」,但 logprobs 会替它喊。读懂这串负数,你就拥有了一台 AI 测谎仪——在它一本正经胡说八道之前,先把它拦下来。
2026-06-25 16:25:26
98
原创 针对这种 只能调接口 的场景,怎么进行幻觉抑制: logprobs
一句话总结:** 调接口(黑盒)时,**模型内部你动不了,但“输入、参数、调用次数、输出校验”这四个口子全在你手里**。核心就两条主线——**RAG + 工具调用**负责“喂对料、外包事实”,**参数约束 + logprobs + 代码校验**负责“收口、兜底、拦截”。
2026-06-25 15:37:30
10
原创 LLM API结束原因与参数调优全指南:finish_reason; response_format
> `finish_reason` 是模型给你的**"结束诊断书"**,而其他参数是**"考前给学生定的规则"**—— > **`temperature` 管心态、`max_tokens` 管字数、`response_format` 管格式、`stop` 管刹车、`seed` 管复现**。 > 五件套配齐,工单分类的稳定性可以提升一个量级。
2026-06-25 15:12:52
7
原创 JSON硬约束解码机制揭秘: response_format={“type“: “json_object“}; finish_reason
response_format={"type": "json_object"}的作用机制是通过约束解码强制模型输出合法JSON格式。其核心原理是在API层校验提示词、注入系统指令,并在推理引擎层实时应用JSON状态机,通过Logit Mask屏蔽非合规token,确保每一步生成都符合JSON语法。相比仅用Prompt提示,这种硬约束将格式正确率从85%提升至99.9%,但需注意:1)仍需Prompt包含"JSON"关键词;2)仅保证格式合法,不确保内容真实;3)若需字段约束需改用json_schema模式。
2026-06-25 14:56:19
6
原创 大模型回答完整性:max_tokens并非万能钥匙
max_tokens 无法保证回答完整性,仅作为输出长度的硬性上限,设置不当反而会导致内容截断(如JSON不闭合)。核心问题包括: 本质矛盾:它是成本限制参数,非完整性保障; 实际风险:设小易截断,设大增加成本/延迟; 关键解决方案: 通过 finish_reason=="length" 检测截断; 强制结构化输出(如JSON)并校验; 自动续写或重试机制; 工单分类场景建议:结合宽松的 max_tokens、JSON校验、finish_reason监控及人工兜底流程,确保业务可靠性。 结论:完整性
2026-06-25 12:11:13
14
原创 大语言模型如何避免胡说八道
大语言模型(LLM)的“幻觉”问题表现为自信地生成错误信息。抑制方案分为四层:提示词工程(如强制拒答)、RAG检索增强(核心方案,通过外部知识库提供参考答案)、工具调用(如计算器/搜索引擎)及后处理验证(如交叉检查)。其中,RAG通过“开卷考试”模式(检索+拼接+生成)显著降低事实性错误,尤其适用于企业知识库场景。更深层解决方案涉及模型内部干预(如知识编辑、表征工程)和训练优化(如拒答对齐)。实际落地需分层组合,从低成本提示词到高投入微调,综合解决LLM“流畅优先”与“事实正确”的矛盾。
2026-06-25 11:49:04
9
原创 LLM 幻觉:解码侧干预:CAD与DAGCD对比机制详解
本文介绍了两种解码侧干预机制CAD和DAGCD,旨在提升大语言模型输出的上下文忠实性。 **CAD(基础版)**通过固定对比强度α,放大上下文相关token的概率。其局限性在于对所有token一刀切,可能影响流畅性或关键事实的纠正强度不足。 **DAGCD(进阶版)**引入动态α机制,利用模型自身的注意力分布自适应调整对比强度:在上下文注意力高的关键事实位(如人名、数字)强化对比,在虚词或模型自信位(如"是"、"的")降低干预。这种方式显著提升长文忠实性(关键token精准纠正)并保持流畅性,但实现需额外获
2026-06-24 20:43:03
307
原创 忠实性幻觉(Context Faithfulness Hallucination)也叫 上下文一致性幻觉
本文系统分析了解决LLM生成中的忠实性幻觉(Context Faithfulness Hallucination)问题的全栈技术方案。文章从五个维度展开:输入侧优化(语义切块、检索增强、提示工程)、解码侧干预(对比解码、注意力引导)、训练微调(SFT、对齐训练)、系统架构(双Agent闭环、自校验)和后置检测(引文校验、LLM裁判)。针对不同场景提供了P0-P2的优先级落地建议,强调RAG本身不能自动解决幻觉问题,需要结合多层面技术手段综合治理。该方案适用于文档问答、摘要生成等要求严格遵循上下文的场景,能显
2026-06-23 20:09:45
31
原创 模型训练过程中会设置topkp和温度吗?
大语言模型训练阶段无需设置top_k、top_p和温度参数,这些仅在推理阶段用于控制文本生成的多样性和确定性。训练时采用最大似然估计和教师强制模式,直接优化正确token的概率分布,不涉及采样过程。而推理阶段会利用这些参数调节采样策略,温度控制分布尖锐度,top_k/p则限制候选token范围。两者分工明确,共同确保模型的训练效果和生成质量。
2026-06-23 20:03:13
19
DebugView 支持win10.rar
2019-05-24
sscomassistant.2.15.0.Installer.x64.exe
2019-06-19
Activity之间使用接口传值.zip
2019-07-30
mengxueping.zip
2019-07-26
jd-windows_jar.zip
2019-09-09
jd_windows.zip
2019-09-09
一个非常强大的测试工具,给大家简单的介绍一下基本使用方法 入门篇,如若不懂,请重新学习小学语文,再来阅读,谢谢!!! 1、
2022-10-08
US_export_policy.jar local_policy.jar
2022-04-23
CAJViewer7.2.0.115.self.zip
2021-12-08
usb-serial-for-android-master.zip
2019-09-10
sokit-1.3.zip
2020-07-13
signapk.jar
2020-03-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅