- 博客(88)
- 资源 (1)
- 收藏
- 关注
原创 OpenAI 开发者大会 Sam Altman 45分演讲带来哪些干货和狠货
北京时间 11 月 7 日凌晨,美国人工智能公司 OpenAI 的开发者大会正式开启,创始人 Sam Altman 在台上和同事,只用 45 分钟时间,就「轰」出了团队最新的成果 GPT-4 Turbo,后者不仅更快、有更长的上下文、而且更好的控制。
2023-11-07 10:24:20
140
1
原创 在 Mac M1 上运行 Llama 2 并进行训练
Llama 2是由领先的人工智能研究公司 Meta(前Facebook)开发并发布的下一代大型语言模型 (LLM)。旨在帮助开发人员和企业组织构建基于人工智能的生成工具和用户体验。本文将指导你完成在 Mac M1 上设置 `Llama 2` 的过程,并根据使用你自己的数据对其进行精调。
2023-10-23 13:42:18
912
3
原创 【白话机器学习系列】白话梯度下降
梯度下降是机器学习中最常见的优化算法之一。理解它的基本实现是理解所有基于它构建的高级优化算法的基础。本文详细为大家推导了 MSE 作为损失函数时的梯度下降公式。
2023-09-09 09:02:11
525
2
原创 用 Python 微调 ChatGPT (GPT-3.5 Turbo)
备受期待的 GPT-3.5 Turbo 微调功能现已推出,为开发人员提供了完美定制人工智能模型的关键解决方案,并以前所未有的方式扩展这些自定义模型。 本文将你经历人工智能进化的惊心动魄之旅。
2023-09-08 13:51:06
1860
2
原创 Stable Diffusion — ControlNet 超详细讲解
ControlNet 是一个控制预训练图像扩散模型(例如 Stable Diffusion)的神经网络。它允许输入调节图像,然后使用该调节图像来操控图像生成。本文为大家深入剖析 ControlNet 的工作原理。
2023-09-07 15:58:02
1421
1
原创 【白话机器学习系列】白话 Dropout
Dropout 是神经网络的一种正则化技术,它在训练时以指定的概率 p(常见值为 p=0.5)丢弃一个单元(连同连接)。在测试时,所有单元都存在,但权重按 p 缩放(即变为 pw)。
2023-06-19 14:45:54
1012
1
原创 【白话机器学习系列】白话Broadcasting
张量之间进行运算需要满足一定的维数条件的,形状大小不满足条件的两个张量之间是无法进行运算的。为了能执行运算,我们通常需要将较小的张量被“拉伸”到与较大张量兼容的形状,这一步“拉伸”操作就是 Broadcasting。
2023-06-05 12:17:47
466
2
原创 Stable Diffusion 超详细讲解
本文将在《Stable Diffusion原理详解》和《Diffusion Model 深入剖析》这两篇文章的基础上,进一步细致地讲解 Stable Diffusion 的算法原理。
2023-06-03 10:42:19
8122
2
原创 【白话机器学习系列】白话张量
张量(Tensor)是向量和矩阵向 n 维的推广。了解张量如何相互作用是机器学习的基本功。本文将用通俗的语言和图例,配合 PyTorch 中张量操作方法为大家深入浅出地讲解张量的必要知识。
2023-06-02 10:52:56
673
1
原创 【白话机器学习系列】白话向量点积
点积(Dot Product)是机器学习中最常见的向量操作。本文将通过简洁易懂的语言配合大量图形为大家介绍点积运算及其背后的数学意义。
2023-06-01 11:16:51
710
原创 TimSort——最快的排序算法
TimSort 算法是 Tim Peters 于 2001 年为 Python 语言创建的。该算法建立在插入排序和归并排序的基础之上,兼具插入排序和归并排序的优点。TimSort 的平均时间复杂度为 O(nlog(n)) ,最好情况 O(n) ,最差情况 O(nlog(n)) 。空间复杂度 O(n) ,是一个稳定的排序算法。
2023-05-31 15:52:47
1349
1
原创 让 Python 真正支持多线程
Python 至今都缺乏对多线程的原生支持。本文深入探讨 Python 无法引入多线程的背后机制,以及如何使用子解释器 API 编写真正并发的 Python 代码。
2023-05-30 10:15:43
875
1
原创 如何成为机器学习工程师
机器学习工程师是一个综合要求很高的交叉学科岗位,要求从业者学习很多必要技能和工具,以应对实际项目中遇到的各种挑战。 本文能为励志成为机器学习工程师的人提供一个清晰的成长路线图。
2023-05-29 15:03:10
351
2
原创 Diffusion Model 深入剖析
本文深入到 Diffusion Model 内部,深入剖析 Diffusion Model 的工作原理以及它是如何生成图像的。本文要点总结:1. 扩散模型分为正向扩散和逆向扩散两部分。2. 正向扩散可以使用闭合的公式来完成。3. 可以使用经过训练的神经网络完成逆向扩散。4. 为了逼近去噪步骤 q,我们只需要使用神经网络 εθ 来近似噪声 εt。5. 对简化损失函数的训练产生更好的样本质量。
2023-05-27 18:05:02
2378
4
原创 【万字长文】深度解析 Transformer 和注意力机制(含完整代码实现)
本文几乎涵盖了关于 Transformer 和注意力机制的所有必要内容,包括自注意力、查询、键、值、多头注意力、掩码多头注意力和 Transformer 架构,以及完整的PyTorch实现。 希望阅读完本文大家对 Transformer 能有深入的理解。
2023-05-25 15:19:57
2703
17
原创 Lamini:大语言模型精调框架
Lamini 致力于解决 LLM 驱动开发中最困难的挑战之一。该框架提供了一个简单且一致的编程模型来抽象跨不同 LLM 的微调过程。我们很可能会在不久的将来看到 Lamini 被纳入不同的 LLM 框架。
2023-05-23 13:55:37
1025
1
原创 Hugging Face Transformers Agent
本文我们探索了🤗Hugging Face Transformers Agents 的功能,并将其与🦜🔗LangChain Agents 进行了比较。
2023-05-17 17:44:27
901
1
原创 Mojo:比 Python 快 35000 倍的 AI 编程语言
Mojo是一门刚刚发布的面向 AI 开发人员的编程语言。Mojo 被设计为 Python 的超集,所以如果你已经掌握了 Python,学习 Mojo 会很容易。关键是 Mojo 将 Python 的易用性与 C 语言的性能相结合,速度比 Python 快 **35000** 倍!让你鱼与熊掌兼得。如果您对 AI 感兴趣并且已经了解 Python,那么 Mojo 绝对值得一试。 这篇文章将带给你有关 Mojo 的所有信息。
2023-05-11 20:38:49
2661
3
原创 用LangChain构建大语言模型应用
LangChain 是一个开源 Python 库,任何可以编写代码的人都可以使用它来构建 LLM 支持的应用程序。 该包为许多基础模型提供了通用接口,支持提示管理,并在撰写本文时充当其他组件(如提示模板、其他 LLM、外部数据和其他工具)的中央接口。
2023-05-01 21:11:35
5468
3
原创 Pandas 2.0发布——更快的速度更低的内存占用
Pandas 是一个用于操作数据的 Python 库,在 Python 开发人员中非常流行。4月3日,Pandas 2.0正式发布。得益于 PyArrow的引入,Pandas 2.0 实现了更快、更节省内存的操作。
2023-04-12 12:14:01
929
1
原创 BloombergGPT: 首个金融垂直领域大语言模型
NLP 在金融技术领域的应用广泛且复杂,主要应用场景包括情感分析、命名实体识别到问答等。大语言模型 (LLM) 已被证明可以有效处理上述任务;但是,鲜少没有报道过有专门针对金融领域的文献。本作中,我们展示了 BloombergGPT 这个拥有 500 亿参数的语言模型,它采用大量金融数据训练而来。我们基于 Bloomberg 大量的数据源构建了一个 3630 亿个token数据集,这可能是迄今为止最大的特定领域数据集,并增加了来自通用数据集的 3450 亿个token。
2023-04-10 13:59:51
2792
2
原创 开源大语言模型(LLM)汇总(持续更新中)
随着ChatGPT的火爆,越来越多人希望在本地运行一个大语言模型。为此我维护了这个开源大语言模型汇总,跟踪每天不发的大语言模型和精调语言模型。
2023-04-06 16:12:36
16825
8
原创 Stable Diffusion XL:更快,更强
总的来说,新模型并没有给我留下深刻印象。MidJourney、Leonardo AI 和 Microsoft Image Generator 仍然有更好看的生成效果。尽管 Stable Diffusion XL 与之前的 AI 模型相比似乎没有显着进步,但它仍然向前迈进了一步,并且肯定还有进一步改进的空间。我期待Stability AI官方能够公布更多细节,而且我坚信最终正式发布的产品会比预览模型更好。
2023-04-04 15:39:17
2873
3
原创 图解NLP模型发展:从RNN到Transformer
本文以NLP模型发展为脉络,详细地解释了RNN、LSTM、GRU、seq2seq、注意力机制和Transformer。每一个技术都给出了清晰的图形化解释,便于大家理解。其中重点解释了Transformer的各个部分,因为Transformer 作为一个重要的里程碑,影响并创建了许多先进的 NLP 模型,如 GPT-3、BERT 等。
2023-03-24 12:11:34
2508
2
原创 文心一言 vs GPT-4 —— 全面横向比较
本文从语义理解、内容创作、逻辑推理、编码能力、数学能力、人格模拟6个维度对文心一言和GPT-4进行了全面系统地横向比较。
2023-03-20 18:44:10
38076
71
原创 GPT-4 API 接口调用及价格分析
对开发者来说,GPT-4最激动人心的是API接口同步发布。我今天获得了API访问权限,本文将跟大家分享GPT-4 API接口的使用以及大家关心的价格分析。
2023-03-19 15:48:02
48930
22
原创 OpenAI 发布GPT-4——全网抢先体验
总的来说,GPT-4在推理能力上比GPT-3.5进步巨大,很多之前的问题都得到了修正和改良。我还没有测试GPT-4的多模能力,后面我会继续进行更多的测试,并即时更新文章分享给大家。
2023-03-15 11:52:23
51020
50
原创 学会这12个Python装饰器,让你的代码更上一层楼
装饰器是一个重要的抽象思想,可以在不改变原始代码的情况下扩展代码。本文整理了项目中经常用到的12个装饰器,值得每一个Python开发者掌握。
2023-03-12 12:29:02
4430
2
原创 万字长文:Stable Diffusion 保姆级教程
万字长文,超详细一步一步教你在本地部署运行当下超火的Stable Diffusion模型,生成各种风格图像。
2023-03-10 11:25:19
61333
94
原创 ChatGPT强化学习大杀器——近端策略优化(PPO)
近端策略优化是当前最先进的强化学习 (RL) 算法。这种优雅的算法可以用于各种任务,并且已经在很多项目中得到了应用,最近火爆的ChatGPT就采用了该算法。本文重点讲解近端策略优化算法,并用PyTorch从头实现一遍。
2023-03-06 10:00:59
7180
11
原创 成本降低90%,OpenAI正式开放ChαtGΡΤ
今天凌晨,OpenAI官方发布ChatGPT和Whisper的API,开发人员现在可以通过API使用最新的文本生成和语音转文本功能。
2023-03-02 18:11:46
36783
13
原创 Stable Diffusion原理详解
本文向大家介绍了图像生成领域最前沿的Stable Diffusion模型。本质上Stable Diffusion属于潜在扩散模型(Latent Diffusion Model)。潜在扩散模型在生成细节丰富的不同背景的高分辨率图像方面非常稳健,同时还保留了图像的语义结构。 因此,潜在扩散模型是图像生成即深度学习领域的一项重大进步。
2023-03-01 14:58:35
14688
3
原创 利用GPT-3 Fine-tunes训练专属语言模型
ChatGPT强大的自然语言理解力和表达力,目前只表现在通用领域。一旦进入专业领域,ChatGPT经常“一本正经,胡说八道”。此时用特定领域的知识对模型进行微调是时间成本和经济成本最高的解决方案。
2023-02-27 15:46:22
8549
11
原创 用Python+ChatGPT批量生成论文概述
用python+GPT-3 API开发了一个可以直接从arxiv地址生成论文概述的工具,大大提升论文阅读速度。
2023-02-25 21:44:11
4195
1
基于TextCNN实现文本分类
2023-02-19
Rust机器学习之Linfa完整项目代码(含数据集)
2023-02-13
用二元泊松模型预测2022年世界杯结果模型源码
2023-02-13
Discrete mean estimates and the Landau-Siegel zero.pdf
2022-11-06
CSDN编辑器如何加入SVG图片
2022-11-06
TA创建的收藏夹 TA关注的收藏夹
TA关注的人