自然语言大模型
文章平均质量分 94
无水先生
擅长数学,能熟练应用泛函分析、统计学、随机过程、逼近论、微分几何、非欧几何(双曲、共形)等数学理论,有数学建模能力。从事图像处理二十年以上,从事人工智能行业10年以上;在船舶、通信、铁路、教育等行业开发软件产品。
展开
-
2018 年 NLP 的 10 个令人兴奋的想法
这篇文章收集了有影响力的 10 个想法,我们将来可能会看到更多。 对于每个想法,我们将重点介绍 1-2 篇执行良好的论文。为了保持列表简洁,这里没有涵盖所有相关工作。该列表必然是主观的,涵盖主要与迁移学习和泛化相关的想法。其中大多数(除了一些例外)都不是趋势(但我怀疑有些可能会在 2019 年变得更加“时尚”)。原创 2024-10-16 20:37:24 · 1097 阅读 · 0 评论 -
利用 VAE、GAN 和 Transformer 释放生成式 AI
生成式人工智能是人工智能和创造力交叉的一个令人兴奋的领域,它通过使机器能够生成新的原创内容,正在彻底改变各个行业。从生成逼真的图像和音乐作品,到创建逼真的文本和身临其境的虚拟环境,生成式人工智能正在推动机器所能实现的界限。在这篇博客中,我们将踏上探索生成式人工智能与VAE、GAN和Transformers的前景的旅程,深入研究其应用、进步以及它对未来的深远影响。原创 2024-07-17 12:41:36 · 1614 阅读 · 0 评论 -
深度学习和NLP中的注意力和记忆
深度学习的最新趋势是注意力机制。在一次采访中,现任 OpenAI 研究总监的 Ilya Sutskever 提到,注意力机制是最令人兴奋的进步之一,而且它们将继续存在。这听起来很令人兴奋。但什么是注意力机制?原创 2024-07-10 13:33:47 · 2628 阅读 · 0 评论 -
终极指南:RNNS、Transformers 和 Diffusion 模型
作为广泛使用这些工具和模型的人,我的目标是解开 RNN、Transformer 和 Diffusion 模型的复杂性和细微差别,为您提供详细的比较,为您的特定需求提供正确的选择。原创 2024-07-02 23:05:28 · 2885 阅读 · 2 评论 -
知识图谱综述
知识图谱是一种抽象数据结构,用于表示从多个数据源中提取的结构化相关信息。例如,幼稚园可用于组织互联网上的大量相关知识,并整合企业内部存在的数据。KG中表示的信息应易于人类理解和验证。原创 2024-06-28 21:18:33 · 3059 阅读 · 0 评论 -
什么是 Azure OpenAI?
关于openAI大模型如何使用?Azure OpenAI 是一套 AI 服务,允许你对数据应用自然语言算法,而无需任何数学、数据科学或机器学习的先验知识。它可以帮助您使应用更加智能,而无需为自然语言编写实际代码。原创 2024-06-27 15:14:31 · 2215 阅读 · 0 评论 -
序列到序列模型中的注意力机制
在人工智能和机器学习领域,注意力机制的概念已成为提高神经网络效率和有效性的有力工具。受人类有选择地关注输入数据特定方面的认知过程的启发,注意力机制允许模型动态地将计算资源分配给给定输入的最相关组件。原创 2024-06-18 19:45:49 · 2156 阅读 · 0 评论 -
什么是隐马尔可夫模型?
被称为隐马尔可夫模型的统计模型是计算生物学中反复出现的主题。什么是隐马尔可夫模型,为什么它们对这么多不同的问题如此有用?原创 2024-06-17 22:46:49 · 2468 阅读 · 1 评论 -
探索序列到序列模型:了解编码器和解码器架构的强大功能
欢迎来到我们进入序列到序列模型世界的旅程!在本博客系列中,我们将深入探讨编码器和解码器架构的迷人领域,揭示它们在理解和生成顺序数据方面的巨大力量。从语言翻译到文本摘要,序列到序列模型通过无缝捕获序列数据中的依赖关系,彻底改变了各个领域。原创 2024-06-17 20:34:57 · 2578 阅读 · 0 评论 -
深入浅出談 隐马尔可夫的概念(2/ 2)-- 训练理论
在许多机器学习的章节中,常常遇见 HMM ,往往看到它的数学式子后,就当没看到似的跳过去了,其实它的基础理论并不难,尤其是 Markov Chain 在高中数学课本就已经出现过了,但…那么久远的事,相信大家都忘得差不多了,现在一起来回顾一下吧!!在前面 part 2 有提醒大家慎入唷! 有满满多出来的数学式,要 hold 住呀!底下我们分成几个部分来说明和算法。原创 2024-06-16 00:05:08 · 2064 阅读 · 0 评论 -
深入浅出談 隐马尔可夫的概念(1/ 2)
在许多机器学习的章节中,常常遇见 HMM ,往往看到它的数学式子后,就当没看到似的跳过去了,其实它的基础理论并不难,尤其是 Markov Chain 在高中数学课本就已经出现过了,但....那么久远的事,相信大家都忘得差不多了,现在一起来回顾一下吧!!原创 2024-06-15 23:38:50 · 2065 阅读 · 0 评论 -
带函数的多代理 AutoGen - 使用代码示例分步
AutoGen 是一个开创性的多智能体对话框架,彻底改变了基础模型的使用方式。这个创新平台具有多功能、可对话的座席,能够通过自动座席聊天集成大型语言模型 (LLM)、工具和人类见解。AutoGen 的独特方法不仅简化了复杂的 LLM 工作流程,而且还最大限度地提高了其性能,标志着下一代 LLM 应用程序开发的飞跃原创 2024-04-13 14:01:30 · 2622 阅读 · 0 评论 -
谈谈变压器中的位置编码
在上一期的“Transformers for Everyone”系列中,我们介绍了 Transformer 的概念,并深入研究了第一个关键架构元素:输入嵌入。如果你错过了第一集,你可以通过阅读来赶上:适合所有人的变形金刚。在本文中,我们将探讨另一个值得我们关注的关键元素:“位置编码”。原创 2024-03-28 13:26:50 · 1903 阅读 · 0 评论
分享