自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (2)
  • 收藏
  • 关注

原创 微软Copilot插件开发系列(一)

懂AI PC的人要先拥抱新世界了。继联想、荣耀之后,微软的首款AI PC马上也要来了。去年9月,Colpilot正式进入Windows 11,成为电脑系统的AI助手。但是,Copilot 无法获取第三方服务的实时信息,例如最新的新闻、天气、股票等。这时,我们就可以使用 OpenAI schema 开发Copilot 插件,来扩展Copilot 的功能,让它能够与我们自己的 API 交互。本文作为该系列的第一篇,将带你初步了解下copilot的基本概念和开发示例。

2024-03-09 10:51:13 1458

原创 【AI产品榜单】盘点国内流量Top10的AI产品

榜单数据源自aicpb,本文摘选出访问流量Top10的产品,逐个为大家介绍文心一言,Kimi Chat,秘塔AI,阿里通义千问,火山方舟,清华智谱,讯飞星火,抖音豆包,AIPPT,稿定AI

2024-04-20 18:51:31 1289 3

原创 【思维链刷题】掌握解题思维链,轻松拿下LeetCode 数位DP Hard题

今天要讲的是一种方法论,即思维链刷题,你可以通过刻意练习,通过一步一步的暗示,来达到解题的目标。正如大模型能够在COT(思维链)的加持下能够一步一步的得到最终的答案,我们在解决LeetCode的编程题时又何尝不是按照这种方式呢?不同的是,我们并没有人给我这种思维链般的“提示”,来指引我们一步一步的通过思考下一步应该做什么,来得到最终的代码。我们只能依靠大脑,不断地提示自己,遵照某一个思维链来解题。那么关键来了,有些人在解题的时候,没有思路,或者思路混乱,这都是思维链没有成型导致的。

2024-04-20 11:19:49 677 1

原创 【推理优化】超详细!AIGC面试系列 大模型推理系列(2)

本期问题快览有哪些常见的大模型推理优化技术介绍下通过流水线处理技术来加速大模型推理方案介绍下并行计算技术来加速大模型推理的方案有哪些通过硬件来加速大模型推理的方式?模型量化是如何加速大模型推理的?有哪些通过缓存来加速大模型推理的方式?vLLM 如何优化大模型并行推理加速什么是 PagedAttention?PagedAttention 技术细节什么是Flash Attention?Flash Attention 技术细节?

2024-04-19 21:59:15 1110 2

原创 斯坦福团队出品,目前最好的AI长文生成?

STORM(Synthesis of Topic Outlines through Retrieval and Multi-perspective Question Asking)是一个由斯坦福大学研究人员开发,旨在利用大语言模型(LLMs)自动化从头开始编写具有维基百科页面般的广度和深度的有根据和有组织的长篇文章。STORM旨在模拟文章写作前的调研过程,通过发掘话题研究中的多样视角、模拟具有不同视角的作者向话题专家提出问题的对话,以及基于这些对话整理收集到的信息来创建文章大纲。

2024-04-19 21:00:42 703 1

原创 【Tokenizer原理篇】超详细!AIGC面试系列 大模型进阶(5)

本期问题快览模型中的Tokenization是指的什么常用的Tokenization方法了解有哪些吗了解什么是Byte-Pair Encoding(BPE)吗介绍下Byte-Pair EncodingBPE的核心算法了解什么是WordPiece吗介绍一下 WordPiece 思路了解什么是SentencePiece吗介绍一下 SentencePiece 思路Byte-Pair Encoding, WordPiece, SentencePiece这三者有什么区别不同大模型LLMs 的分词方

2024-04-18 17:50:34 747 1

原创 【推理框架】超详细!AIGC面试系列 大模型推理系列(1)

本期问题快览有哪些大模型推理框架了解vllm吗介绍下vllm的核心技术了解faster transformer吗介绍下faster transformer的核心技术了解Xinference吗了解llama.cpp项目吗llama.cpp项目突出的优势是什么

2024-04-18 17:49:37 1376 1

原创 【模型微调】超详细!AIGC面试系列 大模型进阶(4)

本期问题聚焦于大模型微调与微调相关技术什么情况下需要微调大模型?什么是大模型参数微调?什么是大模型的指令微调?大模型参数微调的好处?大模型指令微调的好处?预训练和有监督微调操作有什么不同?多轮对话任务如何微调模型?微调后的模型出现能力劣化,灾难性遗忘是怎么回事?微调模型需要多大显存?

2024-03-25 19:58:55 1252 1

原创 超详细!AIGC面试系列 大模型进阶(3)

如何训练自己的大模型?训练中文大模型有啥经验?什么情况下需要预训练大模型样本量规模增大,训练大模型时出现OOM错,怎么解决?模型训练的数据集一般从哪里找?如何解决三个阶段的训练(SFT->RM->PPO)过程较长,更新迭代较慢问题?奖励模型在训练大模型中有什么作用?在训练大型语言模型的过程中,如何确保模型的公平性和无偏见?

2024-03-25 19:41:57 848 1

原创 超详细!AIGC面试系列 大模型进阶(2)

如何让大模型处理更长的文本?如果想要在某个模型基础上做全参数微调,究竟需要多少显存?什么是有监督微调SFTSFT 指令微调数据如何构建?领域数据训练后,通用能力往往会有所下降,如何缓解模型遗忘通用能力?领域模型Continue PreTrain ,如何让模型在预训练过程中就学习到更多的知识?进行SFT操作的时候,基座模型选用Chat还是Base?领域模型微调 领域评测集如何构建

2024-03-11 22:01:47 1367

原创 超详细!AIGC面试系列 大模型进阶(1)

大模型常用的激活函数有哪些?Multi-query Attention 与 Grouped-query Attention 是否了解?区别是什么?GPT3、LLAMA、ChatGLM 的Layer Normalization 的区别是什么?各自的优缺点是什么?llama 输入句子长度理论上可以无限长吗?大模型长下文能力的提升关键是什么?什么是 LLMs 复读机问题?为什么会出现 LLMs 复读机问题?如何减轻LLMs的复读机问题?什么情况用Bert模型,什么情况用LLaMA、ChatGLM类

2024-03-11 21:44:20 1055

原创 超详细!AIGC面试系列 大模型基础(2)

本期问题快浏1. 大模型领域的Scalling law是什么意思2. 大模型的Tokenizer的实现方法及原理?3. 为什么大模型这么消耗显存?4. 简要介绍下Transformer架构5. 训练一个大模型需要哪些步骤?6. 微调一个大模型需要哪些步骤?

2024-03-10 15:54:22 1006 1

原创 超详细!AIGC面试系列 大模型基础(1)

本系列是结合AI搜索技术所得素材然后整理笔记而成。所有问题答案均由AI提供初稿,而后修缮而成。担心提供错误答案怎么办?每个问题回答后面我都会放上原文的链接,方便大家深度阅读。我会尽量根据自己的判断,审核一下AI的回复做点修正,如有纰漏尽情谅解。另外有覆盖不到的问题,尽情留言,我可能不会逐一回复,但一定会在下期更新。

2024-03-10 15:17:39 1609 1

原创 探索元宇宙的数字分身: 数字人行业简析

有人在使用数字人的同时,就有人担心自己被数字人欺骗。有些人可能会用数字人来传。现在,有一些公司和个人开始用数字人在短视频、广告和其他地方跟用户互动。这些数字人看起来很真实,但可能存一些问题:1. 虚假宣传:有些公司可能会使用数字人来做广告,可能会夸大数字人的能力或者误导消费者,导致虚假宣传。2. 侵犯隐私:有时候,数字人的形象可能会被不法分子用来侵犯别人的隐私,比如在媒体上发布虚假信息或者恶意攻击。3. 伦理问题:数字人的使用也涉及到伦理问题。例如,如果一个数字人被用来制作淫秽、暴力或令人不悦的内容。

2024-03-09 11:41:38 1045

原创 中外论文搜集方法整理

中外论文搜集方法整理中文文献IData爱学术外文文献中国科技云Library Genesis中文文献中文文献数据库常见的有中国知网和万方数据,二者几乎涵盖了国内所有领域的中文文献。校园网用户可直接通过IP登录进行文献搜索下载,然对于非校园用户,除购买正式会员外,亦可以通过相关论文资料搜索网站以及代理等方式达到同样效果。IDataIData值得推荐,其数据库较为充实,更新也及时,中文期刊、硕...

2018-12-19 15:18:46 473

python数据工程师公司面试题整理

奥德塔、奥盾、并行科技、大公国际、多来点等公司的python面试题。

2018-06-28

CST软件补丁

CST仿真软件2016版本的破解补丁,点开按照软件界面提示即可。

2018-06-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除