每日一看大模型新闻(2024.1.15)深挖RLHF潜力,复旦语言和视觉团队创新奖励模型优化,让大模型更对齐;阿里“AI替换万物”框架火爆社区,网友:偶像不需要真人了?;上海AI实验室等联合推出中文医

1.产品发布

1.1全新免费编程神器!比Copilot快两倍,准确率高20% 

发布日期:2024.1.15

全新免费编程神器!比Copilot快两倍,准确率高20% | 非十科技发布

主要内容:Fitten Code是一款国产编程神器,它比GitHub Copilot快两倍,准确度提高了约20%。这款工具功能全面,包括代码自动补全、自然语言生成代码、自动添加注释、智能bug查找、解释代码和自动生成单元测试等。值得一提的是,Fitten Code支持80种语言,并且完全免费。目前,Fitten Code已经成为VSCode插件市场趋势榜第一名。

1.2中国电信:开源星辰语义大模型TeleChat-7B版本

发布日期:2024.1.15

主要内容:中国电信开源星辰语义大模型 TeleChat-7B 版本,并开放了 1T 清洗数据集。此外,中国电信还将在 1 月 20 日开源 12B 版本模型,以吸引更多开发者共建开源大模型生态。星辰语义大模型是由中电信人工智能科技有限公司研发训练的大语言模型,采用 1.5 万亿 Tokens 中英文语料进行训练。该模型提出了缓解多轮幻觉的解决方案,通过关键信息注意力增强、知识图谱强化、多轮知识强化、知识溯源能力四大技术,将 AI 大模型的幻觉率降低了 40%,有助于大模型变得更有“人味”,理解问题语境。在中国电信内部和对外企事业单位客户的业务中,星辰语义大模型应用于行文写作、代码编程、网络故障分析、经营分析、企业经营分析、政务公开咨询、民生诉求接待等场景,并取得了良好的效果。此外,该模型已与华为昇腾 AI 基础软硬件完成适配,在模型开发上取得了一定成果。

开源地址https://huggingface.co/Tele-AI/telechat-7B

2.技术更新

2.1点击收获霉霉旗袍写真!阿里“AI替换万物”框架火爆社区,网友:偶像不需要真人了?

发布日期:2024.1.15

点击收获霉霉旗袍写真!阿里“AI替换万物”框架火爆社区,网友:偶像不需要真人了?

主要内容:阿里智能计算研究院提出了一个名为ReplaceAnything的新框架,它可以通过框选需要保留的区域,将图片中的任何物体进行替换。这个工具可以用于服装替换、证件照背景替换、人脸替换和背景替换等多种场景。除了娱乐用途外,它还具有实用性,比如可以根据产品调性来更换人脸,节省明星代言费;或者给各类产品替换背景,省去产品摄影师的费用。目前该工具可以免费试用,用户只需上传图片,选择要保留的对象,输入提示词或参考图像,点击运行生成按钮即可。

体验网址https://huggingface.co/spaces/modelscope/ReplaceAnything

2.2深挖RLHF潜力,复旦语言和视觉团队创新奖励模型优化,让大模型更对齐

发布日期:2024.1.15

深挖RLHF潜力,复旦语言和视觉团队创新奖励模型优化,让大模型更对齐

主要内容:复旦团队在第二份报告中,对大型语言模型的奖励模型(Reward Model)进行了深入的探讨和优化。他们发现,奖励模型是使AI系统与人类价值观对齐的关键因素。为了使大模型更好地符合人类的偏好,他们不仅对数据进行了清洗,去除了噪音数据,还提出了使用对比学习和元学习的方法,提高了奖励模型对数据好坏的甄别能力。这些改进使得大型语言模型更加贴合人类的喜好和价值观,对于未来的AI系统发展具有重要意义。此外,该团队还揭示了RLHF在大语言模型中的基本框架,并深入分析了PPO算法的内部机制。他们的研究为AI领域的发展提供了重要的理论和实践指导,推动了人工智能技术的不断进步和创新。

PPO 论文链接https://arxiv.org/pdf/2307.04964.pdf

Reward Modeling 论文链接https://arxiv.org/abs/2401.06080

2.3谷歌AI通过图灵测试,大模型医生来了?GPT-4竟诊断出难倒17个医生的怪病

发布日期:2024.1.15

https://blog.research.google/2024/01/amie-research-ai-system-for-diagnostic_12.html

主要内容:谷歌DeepMind团队发布全新诊断对话式AI——AMIE,该AI在测试中击败了医生,并通过了图灵测试。AMIE采用了一种强化学习算法中的"自我博弈"方法,在模拟环境中自我对弈,并通过自动反馈机制进行扩展学习。在病人双盲文本测试中,AMIE在诊断呼吸系统和心血管疾病等疾病方面表现出比初级保健医生更准确的诊断能力。研究人员还设计了一项随机、双盲交叉研究,让经过验证的患者与经过认证的初级保健医生或针对诊断对话进行优化的人工智能系统进行互动。谷歌最新研究暗示了AI驱动的诊断对话的未来,并代表着迈向对话式诊断人工智能的一个里程碑。

论文地址https://arxiv.org/pdf/2401.05654.pdf

2.4上海AI实验室等联合推出中文医疗大模型评测框架

发布日期:2024.1.15

上海AI实验室联合多家机构推出评测框架GenMedicalEval,助推医疗大模型能力提升

主要内容:近日,上海AI实验室联合上海交通大学、华东师范大学、上海交通大学附属第九人民医院共同推出了一个名为GenMedicalEval的中文医疗大语言模型评测框架。该联合团队利用超过4万道医学考试真题和近6万份病历(已处理隐私信息),构建了一个大规模数据集,其中包含超过10万例医疗评测数据,覆盖了16个主要科室、3个医生培养阶段和6种医学临床应用场景

在GenMedicalEval评测体系的基础上,联合团队对四个通用大模型(GPT-4、文心一言、通义千问和星火大模型)以及三个参数量较小的医疗领域模型(Huatuo2-13B、MING-13B和DoctorGLM-6B)进行了试验性测试。测试涵盖了选择题、开放式问题和自动评估模型三个评测模块。评测结果显示,通用大模型表现出了较为优异的性能,其中GPT-4表现均衡,没有明显的弱项。

代码链接GitHub - MediaBrain-SJTU/GenMedicalEval

  • 16
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值