![](https://img-blog.csdnimg.cn/20191217091926331.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
精选(人工智能)-中级
![](https://csdnimg.cn/release/blogv2/dist/pc/img/columnHotIcon1.png)
文章平均质量分 80
本专栏主要涵盖最新人工智能、区块链领域的初级和中级技术文章,均为博主精心总结、紧跟前沿、逐步优化、学以致用。文章重点处均有颜色标注,方便阅读和查看。仅【学生身份】且【在读状态】可向博主申请免费查看资格。
优惠券已抵扣
余额抵扣
还需支付
¥99.90
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
一个处女座的程序猿
人工智能硕博学历,拥有十多项发明专利(6项)和软著(9项),包括国际期刊SCI内多篇论文,多个国家级证书(2个国三级、3个国四级),曾获国内外“人工智能算法”竞赛(包括国家级省市级等,一等奖5项、二等奖4项、三等奖2项)证书十多项,以上均以第一作者身份,并拥有省市校级个人荣誉证书十多项。目前也是国内知名博主,连续3年获CSDN十大博客之星,荣获达摩院评测官、阿里社区/CSDN社区/51CTO/华为社区等十多个开发者社区专家博主荣誉,曾受邀阿里/华为/谷歌等社区采访-评审-论坛几十次。截止2022年,AI领域粉丝超100万,文章阅读量超5000万。正在撰写《AI算法最新实战》一书,目前已30万字
展开
-
LLMs之RAG:深度剖析基于大语言模型的RAG系统中优化技巧总结—“用户查询”阶段优化策略经验—Query重写、Query分解、Query增强技术思路分析与代码实验结果对比之详细攻略
LLMs之RAG:深度剖析基于大语言模型的RAG系统中优化技巧总结—“用户查询”阶段优化策略经验—Query重写、Query分解、Query增强技术思路分析与代码实验结果对比之详细攻略目录相关参考内容深度剖析基于大语言模型的RAG系统中优化技巧总结—“用户查询”阶段优化策略经验—Query重写、Query分解、Query增强技术思路分析与代码实验结果对比之详细攻略# 1、定义嵌入模型和LLM# 2、加载数据并预处理:加载网页、文本分割、索引构建# 3、R原创 2024-07-12 02:16:35 · 3645 阅读 · 0 评论 -
LLMs之GLM-4:基于AutoDL云服务器利用自定义json格式指令数据集+数据格式转换(单轮问答对message【user-assistant】、多轮对话)对GLM-4-9b-chat训练(Lo
LLMs之GLM-4:基于AutoDL云服务器利用自定义json格式指令数据集+数据格式转换(单轮问答对message【user-assistant】、多轮对话)对GLM-4-9B训练(LoRA/P-Tuning v2微调)+推理案例的全流程实战目录一、清理服务器缓存二、模型推理三、模型微调3.1、基于GLM-4-9b实现问答对话(单轮)微调3.2、基于GLM-4-9b实现问答对话(多轮)微调一、清理服务器缓存ECS之AutoDL:Au原创 2024-06-07 00:53:03 · 1062 阅读 · 0 评论 -
NLP之ChatGPT:申请OpenAI的API key、多种方法调用API接口实现Chatgpt的炸天功能的图文教程(基于python代码实现)、案例应用之详细攻略
NLP之Chatgpt:申请OpenAI的API key、基于openai框架通过调用API接口实现Chatgpt的吊炸天功能的图文教程(基于python代码实现)、案例应用之详细攻略目录相关文章基于openai框架通过调用API接口实现Chatgpt功能的简介Chatgpt案例应用相关文章Py之OpenAI Python API:openai-python的简介、安装、使用方法之详细攻略https://yunyaniu.blog.csdn.n原创 2022-12-31 23:32:01 · 4599 阅读 · 0 评论 -
DL之LF:损失函数简介——交叉熵损失和负对数似然损失的联系与区别、二分类(二元交叉熵+Sigmoid函数)、多分类(多元交叉熵+Softmax函数)
DL之LF:损失函数简介——交叉熵损失和负对数似然损失的联系与区别、二分类(二元交叉熵+Sigmoid函数)、多分类(多元交叉熵+Softmax函数)目录对比:交叉熵损失(分类问题的损失函数,常用于分类问题+DL)、负对数似然损失(衡量分布之间差异,常用于概率模型+LLM)对比:交叉熵损失(分类问题的损失函数,常用于分类问题+DL)、负对数似然损失(衡量分布之间差异,常用于概率模型+LLM)CELoss简介交叉熵损失(Cross-Entropy Loss,CELoss)是信息论中的一原创 2023-12-16 01:15:30 · 740 阅读 · 0 评论 -
LLMs之RAG:基于Ollama框架(开启服务器模式+加载LLMs)部署LLaMA3/Phi-3等大语言模型、并结合AnythingLLM框架(配置参数LLM Preference【LLM Prov
LLMs之RAG:基于Ollama框架(开启服务器模式+加载LLMs)部署LLaMA3/Phi-3等大语言模型、并结合AnythingLLM框架(配置参数LLM Preference【LLM Provider-Chat Model】 /Embedding Preference/Vector Database)实现RAG功能(包括本地文档和抓取网页)实现Chat聊天以及本地知识库问答实战目录基于Ollama框架(开启服务器模式+加载LLMs)部署LLaMA3/Phi-3等大语言模型、并结合Anyt原创 2024-05-07 01:10:36 · 1836 阅读 · 0 评论 -
Transformer之MQA:多查询注意力(Multi-Query Attention,MQA)的概述(论文+原理等)、代码实现、案例应用之详细攻略
Transformer之MQA:MQA的概述、代码实现、案例应用之详细攻略目录相关论文《Fast Transformer Decoding: One Write-Head is All You Need》翻译与解读AbstractMQA技术的概述MQA的代码实现T1、MQA在 llm-foundry 中的实现MQA的案例应用相关论文《Fast Transformer Decoding: One Write-Head is All You Need原创 2020-03-05 22:51:29 · 1054 阅读 · 1 评论 -
ML之FE:IV值/IV信息量(Information Value)指标(衡量变量的预测能力)的简介、计算逻辑、使用方法之详细攻略
IV,Information Value,信息价值,信息量,用来表示变量对目标预测的贡献程度,也就是预测能力。该指标经常被用在评分卡模型中进行筛选变量。变量的IV值越大,表示自该变量的预测能力越强。但是求IV值,需要先求WOE值,从计算WOE可知,该指标是用在有监督学习,且目标变量为。原创 2022-06-16 15:09:03 · 1926 阅读 · 0 评论 -
DL之ZFNet:ZFNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
DL之ZFNet:ZFNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略目录ILSVRC2013比赛的简介ZFNet算法的简介ZFNet算法的案例应用ILSVRC2013比赛的简介官网地址:ImageNet这篇链接地址,介绍了ILSVRC2013比赛的相关信息。背景:ImageNet数据库和对应分类挑战赛。数据:两个任务,一个是目标检测任务共200类,一个是图像分类任务共1000类。时间表:赛程内容和时间安排。组织者:组织机构与联系方式。赞原创 2019-04-22 11:57:14 · 12066 阅读 · 1 评论 -
DL之CNN可视化:卷积神经网络理解的简介(相关论文/CNN各层级结构输出特征信息可视化)、代码实现理解
DL之CNN可视化:卷积神经网络理解的简介(相关论文/CNN各层级结构输出特征信息可视化)、代码实现理解目录卷积神经网络理解的简介CNN可视化代码实战理解卷积神经网络理解的简介1、CNN各层卷积所干的事(各个层级结构的结果可视化)(1)、卷积操作、ReLU操作、池化操作可视化红色,绿色(2)、ConV1、ConV2、ConV3等层卷积后的结果(3)、转置卷积可视化2、人脸识别任务案例:线段→人脸五官→人脸轮廓原创 2018-08-07 21:45:02 · 10712 阅读 · 2 评论 -
CV:计算机视觉领域(图像分类、目标检测、姿态估计、语义分割)基于各种benchmark数据集及其对应Top算法概述
CV:计算机视觉领域(图像分类、目标检测、姿态估计、语义分割)基于各种benchmark数据集及其对应Top算法概述目录简介使用方法简介您是否曾经想要快速了解哪篇论文在标准数据集X上提供了最佳结果?不用再等待,只需点击下面,发现当前的前沿技术。受到看到太多论文省略最佳方法的挫败感以及受到Hao Wooi Lim博客的启发,在这里,您可以找到一份众包列表,其中包含一些“主要”视觉分类、检测和姿态估计数据集上已知结果。根原创 2018-10-13 21:24:42 · 10519 阅读 · 1 评论 -
ML之TS之TFTS:TFTS库(基于Tensorflow框架实现Time series forecasting时间序列预测任务)的简介(TF旧版本)、使用方法、案例应用之详细攻略
ML之TS之TFTS:TFTS库(基于Tensorflow框架实现Time series forecasting时间序列预测任务)的简介(TF旧版本)、使用方法、案例应用之详细攻略目录相关文章TFTS库的简介TFTS库的案例应用相关文章TS之TFTS:TFTS库(基于Tensorflow框架实现Time series forecasting时间序列预测任务)的简介(TF旧版本)、使用方法、案例应用之详细攻略https://yunyaniu.blog.csd原创 2018-10-16 15:58:02 · 10193 阅读 · 0 评论 -
MAT之GRNN/PNN:基于iris鸢尾花分类数据集利用GRNN(广义回归神经网络)、PNN(概率神经网络)两神经网络算法实现分类预测并进行模型对比(模型性能和运行时间)图文教程及其代码实战
MAT之GRNN/PNN:基于iris鸢尾花分类数据集利用GRNN(广义回归神经网络)、PNN(概率神经网络)两神经网络算法实现分类预测并进行模型对比(模型性能和运行时间)图文教程及其代码实战目录基于鸢尾花分类数据集利用GRNN(广义回归神经网络)、PNN(概率神经网络)两神经网络算法实现分类预测并进行模型对比(模型性能和运行时间)图文教程基于鸢尾花分类数据集利用GRNN(广义回归神经网络)、PNN(概率神经网络)两神经网络算法实现分类预测并进行模型对比(模型性能和运行时间)图文教程原创 2018-02-06 20:55:51 · 16847 阅读 · 2 评论 -
MAT之DNN:基于汽油样品近红外光谱及其辛烷值数据集利用BP及RBF神经网络算法实现回归预测(R2评估)图文教程及代码实战
MAT之NN:实现BP神经网络的回归拟合,基于近红外光谱的汽油辛烷值含量预测结果对比目录输出结果实现代码输出结果实现代码load spectra_data.matplot(NIR') title('Near infrared spectrum curve—Jason niu') temp = randperm(si...原创 2018-02-05 20:41:30 · 17229 阅读 · 143 评论 -
ML之NB:基于垃圾邮件数据集利用多项式朴素贝叶斯分类器实现二分类实战代码
ML之NB:基于垃圾邮件数据集利用多项式朴素贝叶斯分类器实现二分类实战代码目录基于垃圾邮件二分类数据集利用多项式朴素贝叶斯分类器实现二分类实战代码基于垃圾邮件二分类数据集利用多项式朴素贝叶斯分类器实现二分类实战代码垃圾邮件数据集下载地址:Index of /old/publiccorpus实现代码,基于自定义数据集# ML之NB:基于垃圾邮件二分类数据集利用多项式朴素贝叶斯分类器实现二分类实战代码from sklearn.model_selection impo原创 2019-02-22 22:47:09 · 10375 阅读 · 4 评论 -
ML之FE:数据预处理/特征工程之构造特征—构造交互特征(四则运算/多项式)—将输入特征进行多项式映射,即根据两个特征来构造多项式组合特征的代码实战
ML之FE:特征工程之特征构造——将输入特征进行多项式映射——即根据两个特征来构造多项式组合特征的代码实战目录特征工程之特征构造——将输入特征进行多项式映射——即根据两个特征来构造多项式组合特征的代码实战特征工程之特征构造——将输入特征进行多项式映射——即根据两个特征来构造多项式组合特征的代码实战输出结果degree = 3x1 x2 X1^1 * X2^0 X1^0 * X2^1 X1^2 * X2^0 X1^1 * X2^1 X1^0 * X2^2 X1^3 * X2^0 X1原创 2023-12-12 22:58:43 · 881 阅读 · 0 评论 -
ML之LoR:逻辑回归算法的简介(源代码及其参数调优解读)、应用、经典案例之详细攻略
ML之LoR:逻辑回归算法的简介(源代码及其参数调优解读)、应用、经典案例之详细攻略目录逻辑回归LoR算法的简介逻辑回归LoR算法的应用逻辑回归LoR算法的经典案例逻辑回归LoR算法的简介 逻辑回归最适合二进制分类(y = 0或1的数据集,其中1表示默认类)。例如:在预测事件是否发生时,发生的事件被分类为1。在预测人会生病或不生病,生病的实例记为1)。它是以其中使用的变换函数命名的,称为逻辑函数h(x) =1 / (1+e-x),它是一个S形曲线。原创 2017-12-31 15:50:32 · 16079 阅读 · 0 评论 -
DL之AlexNet:AlexNet算法的简介(论文介绍)、架构详解、耗费算力对比、案例应用等配图集合之详细攻略
DL之AlexNet:AlexNet算法的简介(论文介绍)、架构详解、耗费算力对比、案例应用等配图集合之详细攻略目录AlexNet算法的简介AlexNet算法的架构详解AlexNet算法的案例应用相关文章Dataset:数据集集合(CV方向数据集)——常见的计算机视觉图像数据集大集合(建议收藏,持续更新)DL之CNN(paper):关于CNN(卷积神经网络)经典论文原文(1950~2018)简介、下载地址大全(非常有价值)之持续更新(吐血整理)DL之Ale原创 2018-05-06 21:43:14 · 12760 阅读 · 2 评论 -
ML之LiR:机器学习经典算法之线性回归算法LiR的简介、使用方法、代码实现、经典案例之详细攻略
ML之LiR:机器学习经典算法之线性回归算法LiR的简介、使用方法、代码实现、经典案例之详细攻略目录线性回归算法LiR的简介线性回归算法LiR的使用方法线性回归算法LiR的经典案例线性回归算法LiR的简介 线性回归方程是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法之一。线性回归也是回归分析中第一种经过严格研究并在实际应用中广泛使用的类型。按自变量个数可分为一元线性回归分析方程和多元线性回归分析方程。原创 2018-01-25 22:09:19 · 9851 阅读 · 2 评论 -
ML之DictVectorizer:利用DictVectorizer函数对dataframe格式所有类型特征实现数据向量化(数值化)同时处理【类别型】特征(本质是OneHot处理)和【数值型】特征(不
ML之DictVectorizer:利用DictVectorizer函数对dataframe格式所有类型特征实现数据向量化(数值化)同时处理【类别型】特征(本质是OneHot处理)和【数值型】特征(不经过任何处理)代码实战目录利用DictVectorizer函数对dataframe格式所有类型特征实现数据向量化(数值化)同时处理【类别型】特征(本质是OneHot处理)和【数值型】特征(不经过任何处理)代码实战利用DictVectorizer函数对dataframe格式所有类型特征实现数据原创 2023-11-28 00:55:53 · 989 阅读 · 0 评论 -
Py之PySyft:Syft的简介、安装、使用方法之详细攻略
Py之PySyft:Syft的简介、安装、使用方法之详细攻略目录PySyft的简介PySyft的安装PySyft的使用方法PySyft的简介PySyft是一个开源库,在Python中提供安全和私有的深度学习。文档:PySyft’s documentation — PySyft documentationPySyft的安装pip install -i https://pypi.tuna.tsinghua.edu.cn/simple syft更新了一大堆包,太多了也…原创 2023-11-17 01:38:14 · 1433 阅读 · 0 评论 -
ML之DR:T-SNE/TSNE(高维数据可视化+非线性降维)的简介、源码解读、案例应用之详细攻略
ML之DR:T-SNE/TSNE(高维数据可视化+非线性降维)的简介、源码解读、案例应用之详细攻略目录T-SNE/TSNE(高维数据可视化+非线性降维)的简介T-SNE/TSNE的使用方法TSNE源代码实现T-SNE/TSNE(高维数据可视化+非线性降维)的简介T-SNE/TSNE的概述简介T-SNE (t-distributed stochastic neighbor embedding,T分布随机邻域嵌入) 是一种常用于高维数据可视化的算法,是一种非线性降维方法,它可原创 2020-12-18 23:24:27 · 9469 阅读 · 2 评论 -
成功解决ImportError: cannot import name ‘Row‘ from ‘sqlalchemy‘ (D:\ProgramData\Anaconda3\Lib\site-packa
成功解决ImportError: cannot import name 'Row' from 'sqlalchemy' (D:\ProgramData\Anaconda3\Lib\site-packages\sqlalchemy\__init__.py)目录解决问题解决思路解决方法解决问题from sqlalchemy import Column, Integer, Row, String, create_engine, selectImportError: cannot im原创 2023-10-31 22:42:53 · 1708 阅读 · 0 评论 -
NLP之BM25:BM25算法的简介、相关库、案例应用之详细攻略
NLP之BM25:BM25算法的简介、相关库、案例应用之详细攻略目录BM25算法的简介BM25算法的相关库BM25算法的案例应用BM25算法的简介1、BM25算法的概述背景词项频率权重问题:传统的TF-IDF假定词项频率与相关性成正比,但实际上,当词项在文档中出现次数较多时,相关性得分并不线性增加。BM25通过使用平方根函数来更好地建模这种情况。>> TF-IDF算法仅考虑了词项在文档中的出现次数,而没有考虑词项频率的增长对相关性的递减效果。例如,当一个词项在文原创 2023-11-05 17:09:01 · 1103 阅读 · 0 评论 -
LLMs之Embedding:基于sentence_transformers库利用all-MiniLM-L6-v2实现语义相似度搜索的应用(选择模型→对数据集进行向量Embedding→对查询向量Em
LLMs之Embedding:基于sentence_transformers库利用all-MiniLM-L6-v2实现语义相似度搜索的应用(选择模型→对数据集进行向量Embedding→对查询向量Embedding→定义距离度量方法→执行语义相似性搜索)实现代码目录基于sentence_transformers库利用all-MiniLM-L6-v2实现语义相似度搜索的应用(选择模型→对数据集进行向量Embedding→对查询向量Embedding→定义距离度量方法→执行语义相似性搜索)基于原创 2023-10-08 23:06:28 · 1638 阅读 · 0 评论 -
LLMs之Colossal-LLaMA-2:源码解读(train.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插
LLMs之Colossal-LLaMA-2:源码解读(train.py文件)基于给定数据集实现持续预训练LLaMA-2—解析命令行参数→初始化配置(分布式训练环境colossalai+训练日志+加速插件)→数据预处理(初始化分词器+数据处理器+数据加载器)→模型训练(初始化模型/优化器/学习率调度器/梯度检查点/Flash-Attention/设置数据类型/是否加载预训练模型/从上一次训练点继续训练+开启训练循环【分布式训练汇总全局均值/模型定期保存/等】)目录源码解读(train.py文件)基原创 2023-10-06 10:09:45 · 1304 阅读 · 0 评论 -
LLM之Colossal-LLaMA-2:源码解读(init_tokenizer.py文件)实现基于源词表的扩展、(init_model.py文件)实现过计算均值扩展模型、(prepare_pretr
LLM之Colossal-LLaMA-2:源码解读(init_tokenizer.py文件)实现基于源词表的扩展(中文标记的新词汇)进而实现持续预训练、(init_model.py文件)实现过计算均值来扩展模型的嵌入层以适应新的词汇表,然后保存扩展后的模型、(prepare_pretrain_dataset.py文件)将原始数据集进行处理和切片并保存为JSONL格式和 Arrow格式目录一、源码解读(init_tokenizer.py文件)实现基于源词表的扩展(中文标记的新词汇)进而实现持续预训原创 2023-09-27 23:33:20 · 1383 阅读 · 0 评论 -
LLMs之LLaMA-2:源码解读(tokenizer.py文件)基于SentencePiece库执行文本的分词和编码/解码操作—在文本生成和处理过程中,将文本字符串与token ID列表之间进行相互
LLMs之LLaMA-2:源码解读(tokenizer.py文件)基于SentencePiece库执行文本的分词和编码/解码操作—在文本生成和处理过程中,将文本字符串与token ID列表之间进行相互转换,以便与深度学习模型进行交互目录源码解读(tokenizer.py文件)基于SentencePiece库执行文本的分词和编码/解码操作—在文本生成和处理过程中,将文本字符串与token ID列表之间进行相互转换,以便与深度学习模型进行交互# 1、创建日志记录器logger用于记录程序运行时的原创 2023-09-03 13:36:45 · 1537 阅读 · 0 评论 -
LLMs之LLaMA-2:源码解读(generation.py文件)—Llama类实现基于预训练模型的文本生成功能(基于单轮提示实现文本补全/多轮对话生成)=build函数构建Llama实例+init
LLMs之LLaMA-2:源码解读(generation.py文件)—Llama类实现基于预训练模型的文本生成功能(基于单轮提示实现文本补全/多轮对话生成)=build函数构建Llama实例+init函数初始化模型和词表对象+generate函数基于提示文本生成文本序列+sample_top_p辅助函数实现了控制随机性的核心采样策略top-P目录源码解读(generation.py文件)# 0、初始化Llama类,加载预训练LLM模型。# 1、自定义一些数据内容,例如Message、C原创 2023-07-16 01:11:53 · 1200 阅读 · 0 评论 -
LLMs之LLaMA-2:源码解读(model.py文件)模块化思想实现了一个完整的Transformer模型(多头注意力机制+前馈神经网络,RMSNorm+RoPE+并行计算+缓存机制提升效率)
LLMs之LLaMA-2:源码解读(model.py文件)模块化思想实现了一个完整的Transformer模型(多头注意力机制+前馈神经网络,RMSNorm+RoPE+并行计算+缓存机制提升效率)目录源码解读(model.py文件)实现了一个Transformer模型(多头注意力机制+前馈神经网络+旋转嵌入)# 1、定义ModelArgs数据类配置模型参数(用于配置Transformer模型的结构和超参数):用于存储模型的配置参数,包括模型维度、层数、注意力头数、词原创 2023-09-01 00:00:03 · 957 阅读 · 0 评论 -
ML之FE:特征工程/数据预处理—数据清洗—异常值处理技术之对【数值型】字段实现数值截断技术并前后对比可视化
ML之FE:特征工程/数据预处理—数据清洗—异常值处理技术之对【数值型】字段实现数值截断技术并前后对比可视化。原创 2023-04-27 00:13:08 · 865 阅读 · 0 评论 -
NLP之TextSimil:基于两份文档(词频)依次利用词频向量/TF-IDF向量表示法并结合余弦相似度实现文本相似度计算实现代码
NLP之TextSimil:基于两份文档(词频)依次利用词频向量/TF-IDF向量表示法并结合余弦相似度实现文本相似度计算实现代码目录基于两份文档(词频)依次利用词频向量/TF-IDF向量表示法并结合余弦相似度实现文本相似度计算实现代码# 1、定义两份文档# 2、数据预处理# 3、计算相似度实现代码基于两份文档(词频)依次利用词频向量/TF-IDF向量表示法并结合余弦相似度实现文本相似度计算实现代码# 1、定义两份文档# 2、数据预处理CountVecto原创 2023-06-21 19:32:33 · 907 阅读 · 0 评论 -
LLMs之ChatGLM2:基于ChatGLM Efficient Tuning(微调工具包)实现对ChatGLM2进行LoRA微调(CLI/GUI【text-generation-webui】)并进
LLMs之ChatGLM2:基于ChatGLM Efficient Tuning(微调工具包)实现对ChatGLM2进行LoRA微调并进行推理测试图文教程之详细攻略目录1、硬件要求和Python依赖2、代码和模型权重下载3、基于微调工具包实现模型训练与推理1、硬件要求和Python依赖硬件要求模型部署电脑硬件要求:FP16半精度-13GB显存INT8量化 -10GB显存INT4量化 -6GB 显存也可以选择CPU部署,甚至可原创 2023-08-27 23:50:17 · 3567 阅读 · 0 评论 -
LLMs之ChatGLM2:ChatGLM2-6B本地部署之单机推理(API/CLI/GUI)、低成本部署(GPU量化部署/CPU及其量化部署/Mac部署/多卡部署)、有限资源下高效微调(全参/P-t
LLMs之ChatGLM2:ChatGLM2-6B本地部署之单机推理(API/CLI/GUI)、低成本部署(GPU量化部署/CPU及其量化部署/Mac部署/多卡部署)、有限资源下高效微调(全参/P-tuning v2)、模型评估和推理之图文教程之详细攻略目录一、配置基础环境及其注意事项二、模型微调:让通用走向专业三、模型评估和推理一、配置基础环境及其注意事项第一步、检测软硬件环境设备和原创 2023-08-27 23:36:44 · 1455 阅读 · 0 评论 -
LLMs之LLaMA-2:基于云端进行一键部署对LLaMA2模型实现推理(基于text-generation-webui)执行对话聊天问答任务、采用LoRA微调LLaMA-2-7B模型(配置云端环境【
LLMs之LLaMA-2:基于云端进行一键部署对LLaMA2模型实现推理(基于text-generation-webui)执行对话聊天问答任务、同时微调LLaMA2模型(配置云端环境【A100】→下载数据集【datasets】→加载模型【transformers】→分词→模型训练【peft+SFTTrainer+wandb】→基于HuggingFace实现云端分享)之图文教程详细攻略目录一、基于云端(在Google Colab上)进行一键部署并推理二、基于云端(在Google Co原创 2023-07-30 22:33:30 · 1970 阅读 · 0 评论 -
LLMs:Text generation web UI/text-generation-webui(一款帮助LLMs实现本地化部署和微调的GUI界面式工具,非CLI式)的简介、安装、使用方法之详细攻略
LLMs:Text generation web UI(一款帮助LLMs实现本地化部署和模型微调的GUI界面式工具,非CLI式)的简介、安装、使用方法之详细攻略目录Text generation web UI的简介Text generation web UI的安装Text generation web UI的使用方法Text generation web UI的简介Text genera原创 2023-07-30 22:35:16 · 1668 阅读 · 0 评论 -
LLMs之LLaMA-2:基于text-generation-webui工具来本地部署并对LLaMA2模型实现推理执行对话聊天问答任务(一键安装tg webui+手动下载模型+启动WebUI服务)、同
LLMs之LLaMA-2:基于text-generation-webui工具来本地部署并对LLaMA2模型实现推理执行对话聊天问答任务(一键安装tgwebui+手动下载模型+启动WebUI服务)、同时微调LLaMA2模型(采用Conda环境安装tgwebui+PyTorch→CLI/GUI下载模型→启动WebUI服务→GUI式+LoRA微调→加载推理)之图文教程详细攻略目录基于Text generation web UI工具实现对话聊天大模型应用一、本地部署实现推理原创 2023-08-20 07:53:45 · 2934 阅读 · 1 评论 -
LLMs之spaCy:利用spaCy管道训练大模型案例—对预训练的BERT、XLNet和GPT-2实现图文教程之详细攻略
LLMs之spaCy:利用spaCy管道训练大模型案例—对预训练的BERT、XLNet和GPT-2实现图文教程之详细攻略目录利用spaCy管道对预训练的BERT、XLNet和GPT-2实现利用spaCy管道对预训练的BERT、XLNet和GPT-2实现官方文章:spacy-transformers:🛸用于预训练的BERT、XLNet和GPT-2的spaCy管道-面圈网加载在大量文本上预训练的大型通用模型,然后开始使用针对您的问题的标签在较小的数据集上进行训练,实现于文本分原创 2023-06-10 02:10:15 · 1031 阅读 · 0 评论 -
AI之KE:Knowledge Engineering知识工程的简介、发展、应用案例之详细攻略
AI之KE:Knowledge Engineering知识工程的简介、发展、应用案例之详细攻略目录Knowledge Engineering知识工程的简介0.1、What0.2、How0.3、Why1、知识工程过程的5个活动2、知识图谱的应用Knowledge Engineering知识工程的发展1、前知识工程时期——1950-1970时期:图...原创 2019-07-22 07:41:20 · 4645 阅读 · 0 评论 -
ML之RF:kaggle比赛之利用titanic(泰坦尼克号)数据集建立RF模型对每个人进行获救是否预测实现代码
ML之RF:kaggle比赛之利用titanic(泰坦尼克号)数据集建立RF模型对每个人进行获救是否预测。原创 2018-08-16 22:08:35 · 11943 阅读 · 4 评论 -
NLP之GloVe:LSA/GloVe的简介、使用方法、案例应用之详细攻略
NLP之GloVe:LSA/GloVe的简介、使用方法、案例应用之详细攻略目录GloVe的简介GloVe的案例应用GloVe的简介LSA/GloVe算法的概述LSA简介LSA全称Latent semantic analysis,隐含语义分析。它算是主体模型topic model的一种,对于LSA的直观认识就是文章里有词语,而词语是由不同的主题生成的。比如一篇文章包含词语:计算机,另一篇文章包含词语:电脑;在一般的向量空间来看,这两篇文章不相关,但是在LSA看来,这两个原创 2020-07-02 10:41:48 · 5679 阅读 · 1 评论