自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 第二课堂实践感想与学习笔记

在第四大节课中,我们学习了大语言模型,分为了两个小节课来学习,我同样对我所学习到的知识进行了总结,主要就是以下的3点:1.简单认识了大语言模型:①概念:transformer是构成所有大语言模型的最核心的模块,通过将输入序列分解为一个个独立的token(例如单词或字符),并分别对每个token应用注意力机制,从而能够并行处理整个序列。若想要降序排列,括号里应该写ascending=False13.对某一列数据进行基本统计:describe函数,可以得到数据大小,平均值,标准差,方差,最大值,最小值等。

2024-08-24 22:18:30 311

原创 第二课堂智能体

7.如何将文本变为向量:①one-hot编码 缺点:①当文本较长时,向量会很长②无法计算出两个向量之间的相似度 ②整数编码:缺点:无法计算出两个向量之间的相似度③embedding:可以将词语或者句子映射到坐标中,可以是二维也可以是高维,当两个词语或句子相近时,在空间上也是相近的。8.有时检索到的文本是很长的,大模型可以将检索到的文本进行剪切,比如将200字或300字作为一块,然后将剪切为一块的那些文字进行embedding并进行存储(向量和所对应的文本存储在一起)

2024-08-12 16:55:00 138

原创 第二课堂大模型

简单认识了大语言模型:①概念:transformer是构成所有大语言模型的最核心的模块,通过将输入序列分解为一个个独立的token(例如单词或字符),并分别对每个token应用注意力机制,从而能够并行处理整个序列。它的核心是注意力机制:通过注意力机制,transformer能够聚焦于输入序列中的重要部分。②发展历程③LLM的功能④LLM的特点。

2024-07-31 19:23:20 329

原创 第二课堂阿里云

当备指标相差很大时,如果直接使用原始指标債计算综合指标,就会实出数值较大的指标在分析中的作用、削弱数值较小的指标在分析中的作用。不使用特征缩放的缺点:知特征x1的数值是100左右,特征x2的数值是1左右,方程为y=w1x1+w2x2,则w1对y的影响就更大,对Loss的影响也更大,损失函数关于w1的梯度也更大,而损失函数关于w2的梯度却很小,因此两个特征就不能使用相同的学习率。1.简单学习了梯度下降思想(导数与梯度是不一样的,一个是标量,一个是矢量):我们可以根据导数day/dx,对X进行迭代。

2024-07-23 10:43:42 173

原创 第二课堂pandas入门

12.让列索引进行升序或降序排列:sort_index函数,括号里应写axis=1。11.让行索引进行升序或降序排列:sort_index函数,若直接运用,默认为升序排列;10.让某一列进行降序或升序排列:sort_values这个函数中by参数指向要排列的列,ascending参数指向排序的方式(升序还是降序)13.对某一列数据进行基本统计:describe函数,可以得到数据大小,平均值,标准差,方差,最大值,最小值等。5.查看表格前几行:head(数字),查看表格后几行:tail(数字)

2024-07-21 10:41:42 182

原创 第二课堂第一节课学习笔记

4、在所给的链接中https://www.runoob.com/python3/python3-basic-syntax.html中学习了一些Python的基础知识,比如读取文件、在文件中写一些东西。2、学会了使用jupyter notebook来编写代码,以及在终端中打开jupyter的方法,需要做miniconda所创建的Python环境中打开。3、学习了如何在jupyter notebook中打开所需要的文件,即在进入环境后,jupyter notebook+文件所在的路径。

2024-07-17 19:48:23 106

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除