自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 Part4-实现对大模型生成结果的评测研究

一、自动化评测的背景和技术挑战:二、性能评估的方法1、三、偏好数据集准备四、不同技术路线1、Model-evaluation自动化评测路线2、Benchmarking- 静态评测路线五、案例集合1、

2024-05-28 23:02:24 115

原创 Part3-实现一个agent

前一篇文章提到了如何为ChatGPT/LLM大语言模型添加额外知识,其中第3点“通过langchain这个chatgpt编程框架来给chatgpt赋能。langchain可以将不同的工具模块和chatgpt给链接(chain)起来”。今天我们要做一个类似于langchain功能的微小智能体,去完成这个目标。

2024-05-24 22:41:30 805 1

原创 Part2- RAG微小实现

检索增强生成技术(Retrieval-Augmented Generation,RAG是一种使用私有或者专有数据源的信息来辅助文本生成的技术,它将检索模型(设计用于搜索大型数据集或知识库)和生成模型(例如大语言模型LLM)结合在一起。通过从更多数据源添加背景信息,以及通过训练来补充 LLM 的原始知识库,检索增强生成能够提高搜索体验的相关性。这能够改善大型语言模型的输出,但又无需重新训练模型。

2024-05-20 23:37:58 1010

原创 Part1-Qwen模型介绍

Transformer由论文《Attention is All You Need》提出,Transformer 由 Encoder 和 Decoder 两个部分组成,Encoder 和 Decoder 都包含 6 个 block。Transformer 的工作流程大体如下:第一步:获取输入句子的每一个单词的表示向量 X,X由单词的 Embedding(Embedding就是从原始数据提取出来的Feature) 和单词位置的 Embedding 相加得到。第二步:将得到的单词表示向量矩阵 (如上图所示,

2024-05-17 00:21:42 2118 1

原创 机器学习基础模型回顾

主要回顾下几个常用算法的适应场景及其优缺点!机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验。通常最开始我们都会选择大家普遍认同的算法,诸如SVM,GBDT,Adaboost,现在深度学习很火热,神经网络也是一个不错的选择。假如你在乎精度(accuracy)的话,最好的方法就是通过交叉验证(cross-validation)对各个算法一个个地进行测试,进行比较,然后调整参数确保每个算法达到最优解,最后选择

2021-03-15 23:20:11 175

原创 test

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar

2021-03-14 22:06:44 52

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除