大语言模型
文章平均质量分 91
书生·浦语
这个作者很懒,什么都没留下…
展开
-
不是吧?这么好用的开源标注工具,竟然还有人不知道…
与常见的标注工具不同,LabelU提供了非常灵活、丰富和可自定义组合的标签工具,就像是一套为AI研究员量身打造的“积木”。原创 2024-08-20 17:21:15 · 1902 阅读 · 0 评论 -
text2vec 如何选择 chunksize 和 splitter?
面对这些 RAG 问题,本文根据 text2vec 模型原理做假设,并用 HuixiangDou 真实数据进行验证,最终给出 chunksize 上下界。本文认为关键是让 tokenize 后的长度和模型输入(如 512)对齐,以发挥出模型完整编码能力。而 chunksize 只是 splitter 的附属选项。原创 2024-08-02 11:51:30 · 1093 阅读 · 0 评论 -
让AI成为人类的Intern,书生通用大模型体系迈向通专融合 | WAIC 2024
7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC)正式开幕。在当天下午举行的科学前沿主论坛上,上海人工智能实验室(上海AI实验室)发布通专融合系列成果。原创 2024-07-30 10:59:22 · 1126 阅读 · 0 评论 -
周伯文:通专融合是通往AGI的战略路径
7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)在上海开幕。上海人工智能实验室主任、首席科学家,清华大学惠妍讲席教授,衔远科技创始人周伯文在WAIC 2024科学前沿主论坛上发表开场报告。以下为报告全文。原创 2024-07-30 10:49:46 · 910 阅读 · 0 评论 -
书生·浦语2.5发布,支持百万长文,推理能力开源领先 | WAIC 2024
在7月4日举行的WAIC 2024科学前沿主论坛上,上海人工智能实验室(上海AI实验室)发布通专融合系列成果。作为书生·浦语系列大语言模型的最新版本,书生·浦语2.5具备一百万词元(Token)的超长文本窗口及开源模型中领先的推理能力,并支持自主规划和在线信息整合,成为助力复杂问题高效解决的得力AI助手。原创 2024-07-29 15:41:39 · 831 阅读 · 0 评论