
中文大模型
文章平均质量分 91
余生H
I AM A I,身上的刺蜕了,只想静静欣赏世界的美。前端、Nodejs后端、容器化云原生、LLMs、CV
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
通义千问综合代码能力测试:制作web版五子棋
前不久申请了千问的代码模式,最近发现出现了这个入口,看来是通过了,是时候测试一下了。之前用claude做过游戏,效果不错Claude生成游戏测试:俄罗斯方块 - 集成InsCode快来阅读并即时体验吧~通义千问web版本:https://tongyi.aliyun.com模式:代码模式时间:2024-11-17单独为代码模式设计的一个全屏编辑和预览弹窗,截图如下所示:工具栏说明:编写一个web版本的五子棋结果如下效果预览默认落子整体来看,与cluade相比,功能和完善度都有待提升,不过也能原创 2024-11-17 21:36:48 · 1620 阅读 · 2 评论 -
国产大模型基础能力大比拼 - 计数:通义千文 vs 文心一言 vs 智谱 vs 讯飞-正经应用场景的 LLM 逻辑测试
在这次测试中,GPTo1-mini、文心一言3.5、讯飞4.0Ultra成功通过了第一轮测试,而GPT4o、智谱GLM-4、通义千文2.5则在经过 COT 提示后取得了正确答案。这说明大多数大模型在面临逻辑推理和计数任务时,借助 COT 提示能够显著提高其正确率。链式推理提示可以让模型逐步分析问题,从而减少犯错的概率。唯一的失败者是讯飞4.0-Lite,即使在提示下也未能改善其答案,这反映了其在推理链方面的不足。这表明该模型在面对需要复杂推理的任务时,仍有待提高,这可能需要进一步的算法优化和训练改进。原创 2024-10-17 17:47:27 · 2237 阅读 · 0 评论 -
大语言模型特供版汉字:基于部首分解与图神经网络的多因素表示
汉字嵌部首,图卷蕴深机。嵌入相结合,结构见玄机。泛化能力强,共享共根基。原创 2024-09-12 15:29:41 · 1375 阅读 · 0 评论 -
传统汉字正面临危机?互联网时代呼唤‘新中文‘的崛起
汉字美如画,变化却挺难;嵌入很方便,语义跑一半。想造新语言,或更新表示;利弊要权衡,改变挡不住。原创 2024-09-11 14:21:30 · 2352 阅读 · 0 评论