- 博客(24)
- 收藏
- 关注
原创 书生·浦语大模型实战营六节课笔记和作业汇总
第一节课 书生·浦语大模型全链路开源体系 笔记: https://blog.csdn.net/zpc1219/article/details/135416066第二节课 轻松玩转书生·浦语大模型趣味Demo 笔记及作业: https://blog.csdn.net/zpc1219/article/details/135440100第三节课 基于 InternLM 和 LangChain 搭建你的知识库 笔记及作业: https://blog.csdn.net/zpc1219/article/detail
2024-01-29 11:29:13 515
原创 书生·浦语大模型实战营第六节课笔记及作业
由于 OpenCompass 默认并行启动评估过程,我们可以在第一次运行时以 --debug 模式启动评估,并检查是否存在问题。在 --debug 模式下,任务将按顺序执行,并实时打印输出。在按照上述步骤正确安装 OpenCompass 并准备好数据集后,可以通过以下命令评测。中的步骤在InternStudio中的 A100(1/4)*2 机器上一步步操作即可!主要评测对象为语言大模型与多模态大模型。我们以语言大模型为例介绍评测的具体模型类型。
2024-01-23 10:50:17 1023
原创 书生·浦语大模型实战营第四节课笔记及作业
大语言模型LLM是在海量的文本内容基础上,以无监督或半监督方式进行训练的。海量的文本内容赋予了大模型各种各样的行业知识。但是如果直接把大模型的知识用于生产实践,会发现回答不大满意。微调的目的就是让LLM在具体的场景或领域中能够得到更好的回答。
2024-01-13 19:37:32 1090
原创 书生·浦语大模型实战营第三节课笔记及作业
然后,构建检索问答链,还需要构建一个 Prompt Template,该 Template 其实是一个带变量的字符串,在检索之后,LangChain 会将检索到的相关文档片段填入到 Template 的变量中,从而实现带知识的 Prompt 构建。from langchain . prompts import PromptTemplate # 我们所构造的 Prompt 模板 template = """使用以下上下文来回答用户的问题。如果你不知道答案,就说你不知道。总是使用中文回答。
2024-01-10 21:06:04 1167
原创 图像分类之卷积神经网络的基础知识
1.1卷积神经网络的发展历史1940年神经网络的概念被提出,1960年感知机的概念被提出,但一直没得到实践应用,直到1989年用于手写字符识别的LeNet模型被LeCun等人提出,该模型在部分领域受到广泛应用,但在此之后神经网络的发展再次陷入瓶颈。直到2006年的深度自动编码网络被Hinton等人提出,随之的一种深度神经网络的训练策略推动了非监督学习的发展。2010年之后由于硬件资源的巨大进步,GPU之类的计算设备大大加快了神经网络的计算速度,训练和推理速度被大大缩短;公开数据集不断扩充,大规模公开数据集
2021-03-10 22:08:12 1467
转载 百度PGL图神经网络7日打卡营Task3:GCN+GAT
第三课:图神经网络算法(一)本次作业内容:实现GCN模型和GAT 模型的send和recv 函数。# 安装依赖# !pip install paddlepaddle==1.8.5!pip install pgl -q1. GCN模型paddle官网查看相关API的用法。注:这里我们给出的是简化版本的 GCN 模型,完整的 GCN 代码可查看: https://github.com/PaddlePaddle/PGL/blob/main/pgl/layers/conv.py#L27GCN部分原
2020-11-29 14:03:55 1887
原创 GNN部分原理
***摘要:我们提出了一种对图结构数据进行半监督学习的可扩展方法,该方法是基于直接在图上操作的卷积神经网络的一个有效变体。基于谱图卷积的一阶局部逼近,激励我们的卷积结构的选择。我们的模型线性地缩放图的边数,并学习隐层表示,该表示既编码局部图结构,又编码节点的特征。***介绍:1、度矩阵与邻接矩阵的概念:度矩阵D:度矩阵是对角阵,对角上的元素为各个顶点的度。顶点vi的度表示和该顶点相关联的边的数量。无向图中顶点vi的度d(vi)=N(i)。(环的话,关联两次)注意:有向图中,顶点vi的度分为顶点v
2020-11-29 14:00:33 462
原创 动手学习深度学习(Pytorch版)Task 3:过拟合欠拟合及其解决方案和梯度消失、梯度爆炸学习总结
一、过拟合欠拟合及其解决方案过拟合和欠拟合是模型训练中经常出现的两类典型问题。在实践中,我们要尽可能同时应对欠拟合和过拟合。虽然有很多因素可能导致这两种拟合问题,但在这里我们将要重点讨论两个因素:模型复杂度和训练数据集大小。最后将提出几种解决方案。欠拟合我们将模型无法得到较低的训练误差这一现象称作欠拟(underfitting)。让我们观察一下欠拟合现象:与正常拟合现象相比:我们可...
2020-02-17 13:18:52 467
转载 动手学习深度学习(Pytorch版)Task 2:循环神经网络基础
循环神经网络本节介绍循环神经网络,下图展示了如何基于循环神经网络实现语言模型。我们的目的是基于当前的输入与过去的输入序列,预测序列的下一个字符。循环神经网络引入一个隐藏变量HHH,用HtH_{t}Ht表示HHH在时间步ttt的值。HtH_{t}Ht的计算基于XtX_{t}Xt和Ht−1H_{t-1}Ht−1,可以认为HtH_{t}Ht记录了到当前字符为止的序列信息,利用HtH_{t}H...
2020-02-16 19:55:30 606
转载 动手学习深度学习(Pytorch版)Task 2:语言模型
语言模型一段自然语言文本可以看作是一个离散时间序列,给定一个长度为TTT的词的序列w1,w2,…,wTw_1, w_2, \ldots, w_Tw1,w2,…,wT,语言模型的目标就是评估该序列是否合理,即计算该序列的概率:P(w1,w2,…,wT).P(w_1, w_2, \ldots, w_T).P(w1,w2,…,wT).下面将介绍基于统计的语言模型,主要是nnn元语法...
2020-02-15 20:57:28 181
原创 动手学习深度学习(Pytorch版)Task 2:文本预处理
文本预处理文本是一类序列数据,一篇文章可以看作是字符或单词的序列,文本数据常见的预处理四个步骤如下:读入文本分词建立字典,将每个词映射到一个唯一的索引(index)将文本从词的序列转换为索引的序列,方便输入模型读入文本数据集:英文小说——H. G. Well的Time Machineimport collectionsimport redef read_time_mach...
2020-02-15 15:59:22 10636 1
原创 动手学习深度学习(Pytorch版)Task 2:文本预处理
文本预处理文本是一类序列数据,一篇文章可以看作是字符或单词的序列,文本数据常见的预处理四个步骤如下:读入文本分词建立字典,将每个词映射到一个唯一的索引(index)将文本从词的序列转换为索引的序列,方便输入模型读入文本数据集:英文小说——H. G. Well的Time Machineimport collectionsimport redef read_time_mach...
2020-02-14 16:51:22 264
原创 动手学习深度学习Task1:以Softmax回归与分类模型为例总结所学
Softmax回归与分类模型概念Softmax回归虽带有“回归”二字,但却是用来解决分类问题的。它可以用一个单层神经网络来形象化表示,如下图:在这里,输入层有四个特征x1、x2、x3、x4x_1、x_2、x_3、x_4x1、x2、x3、x4,输出层有三个输出神经元o1、o2、o3o_1、o_2、o_3o1、o2、o3。由于输入层与输出层之间只有一层权重与偏置,我们一般称输入层为...
2020-02-12 15:10:50 272
原创 浅谈文本情感分析
在大数据和人工智能的时代,机器能否拥有情感成为人们热议的话题。真正的人工智能系统不仅具有像人类的思考和推理能力,也需要能够感知和表达情感。还记得《魔幻手机》那部经典的国产电视剧中的傻妞么?在电视剧最后她和主人公相爱的故事,激起了我对人工智能拥有人类情感的无限想象。在未来,机器人走向千家万户,和手机一样成为人类生活的一部分是一种必然的趋势。那么你是愿意整天面对的是一丝不苟、冷冰冰地执行任务的毫无情...
2019-06-02 16:51:01 4189
原创 模拟登录丁香园获取全部回复
采用selenium与xpath结合,先模拟登录再进行相关信息爬取,不过我不是仅仅把上次爬取丁香园的代码强加上去,我把取得源代码的自定义函数去掉,用了selenium的get函数,url用的是登陆后的url,可以用这样直接得到登录之后爬取页的源代码,之后的解析就很简单了。源代码如下:![在这里插入图片描述](https://img-blog.csdnimg.cn/2019041220485...
2019-04-12 20:59:47 251
原创 模拟登陆及IP知识相关学习
一、使用selenium模拟登陆163邮箱注意一定要用google浏览器,我刚开始默认浏览器为QQ浏览器,然后就出现错误,还有chromedriver要下浏览器对应版本,否则可能无法作用。我是把下载后的ChromeDriver的可执行文件拖到了Python的Scripts目录下了,此外当然可以采用另一种方法即单独将其所在路径配置到环境变量。好了,话不多说,直接上代码:为了不必不同的用户输入...
2019-04-11 18:35:10 252
原创 爬虫学习(二)
import requestsfrom requests.exceptions import RequestExceptionimport jsonfrom bs4 import BeautifulSoupimport timedef get_one_page(url):try:headers = {‘User-Agent’: ‘Mozilla/5.0 (Macintosh; In...
2019-04-09 22:02:13 137
原创 爬虫学习(一)
1.1(1)GET与POST请求:当我们在浏览器中直接输入URL并回车,这便发起了一个GET请求,请求的参数会直接包含到URL中。至于POST请求,它大多于表单提交时发起,其数据是以表单形式传输,并不会体现在URL中。二者区别:a、GET是请求页面并返回页面内容,其请求中的参数包含在URL中,数据可以在URL中看到,而POST请求的URL中不会包含这些数据,数据大都是通过表单形式传输的,会...
2019-04-06 23:43:58 437
原创 决策树算法梳理
一、信息论基础(1)信息论:信息论最早来自于通信领域,也叫通信理论,主要研究信息的获取,变换,传输,处理。(2)信息熵与信息增益:信息熵表示的是不确定度。均匀分布时,不确定度最大,此时熵就最大。当选择某个特征对数据集进行分类时,分类后的数据集信息熵会比分类前的小,其差值表示为信息增益。信息增益可以衡量某个特征对分类结果的影响大小。(3)基尼不纯度:a、基尼值:基尼值 Gini(D) 反...
2019-04-03 17:44:41 253
原创 逻辑回归算法梳理
一、逻辑回归原理逻辑回归(Logistic Regression, LR)又称为逻辑回归分析,是分类和预测算法中的一种。通过历史数据的表现对未来结果发生的概率进行预测。例如,我们可以将购买的概率设置为因变量,将用户的特征属性,例如性别,年龄,注册时间等设置为自变量,根据特征属性预测购买的概率。它是以逻辑函数为联系函数的线性模型。逻辑函数也称为Sigmoid函数,表达式如下:Sigmoid(Sco...
2019-03-31 17:46:33 240
原创 机器学习基础知识梳理
一、机器学习的基本概念1、定义:机器学习是指对于某个特定任务,从数据中学出一个模型,然后用某种衡量方式来表示该模型的性能。2、机器学习常见任务:a、分类 b、输入缺失分类 c、回归 d、转录 e、机器翻译 f、结构化输出 g、异常检测 h、合成和采样 i、缺失值填补 j、去噪 k、密度估计或概率质量函数估计3、性能度量:为了评估机器学习算法...
2019-03-29 20:44:21 558
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人