- 博客(6)
- 收藏
- 关注
原创 第二课堂实践感想与学习笔记
在第四大节课中,我们学习了大语言模型,分为了两个小节课来学习,我同样对我所学习到的知识进行了总结,主要就是以下的3点:1.简单认识了大语言模型:①概念:transformer是构成所有大语言模型的最核心的模块,通过将输入序列分解为一个个独立的token(例如单词或字符),并分别对每个token应用注意力机制,从而能够并行处理整个序列。若想要降序排列,括号里应该写ascending=False13.对某一列数据进行基本统计:describe函数,可以得到数据大小,平均值,标准差,方差,最大值,最小值等。
2024-08-24 22:18:30 311
原创 第二课堂智能体
7.如何将文本变为向量:①one-hot编码 缺点:①当文本较长时,向量会很长②无法计算出两个向量之间的相似度 ②整数编码:缺点:无法计算出两个向量之间的相似度③embedding:可以将词语或者句子映射到坐标中,可以是二维也可以是高维,当两个词语或句子相近时,在空间上也是相近的。8.有时检索到的文本是很长的,大模型可以将检索到的文本进行剪切,比如将200字或300字作为一块,然后将剪切为一块的那些文字进行embedding并进行存储(向量和所对应的文本存储在一起)
2024-08-12 16:55:00 138
原创 第二课堂大模型
简单认识了大语言模型:①概念:transformer是构成所有大语言模型的最核心的模块,通过将输入序列分解为一个个独立的token(例如单词或字符),并分别对每个token应用注意力机制,从而能够并行处理整个序列。它的核心是注意力机制:通过注意力机制,transformer能够聚焦于输入序列中的重要部分。②发展历程③LLM的功能④LLM的特点。
2024-07-31 19:23:20 329
原创 第二课堂阿里云
当备指标相差很大时,如果直接使用原始指标債计算综合指标,就会实出数值较大的指标在分析中的作用、削弱数值较小的指标在分析中的作用。不使用特征缩放的缺点:知特征x1的数值是100左右,特征x2的数值是1左右,方程为y=w1x1+w2x2,则w1对y的影响就更大,对Loss的影响也更大,损失函数关于w1的梯度也更大,而损失函数关于w2的梯度却很小,因此两个特征就不能使用相同的学习率。1.简单学习了梯度下降思想(导数与梯度是不一样的,一个是标量,一个是矢量):我们可以根据导数day/dx,对X进行迭代。
2024-07-23 10:43:42 173
原创 第二课堂pandas入门
12.让列索引进行升序或降序排列:sort_index函数,括号里应写axis=1。11.让行索引进行升序或降序排列:sort_index函数,若直接运用,默认为升序排列;10.让某一列进行降序或升序排列:sort_values这个函数中by参数指向要排列的列,ascending参数指向排序的方式(升序还是降序)13.对某一列数据进行基本统计:describe函数,可以得到数据大小,平均值,标准差,方差,最大值,最小值等。5.查看表格前几行:head(数字),查看表格后几行:tail(数字)
2024-07-21 10:41:42 182
原创 第二课堂第一节课学习笔记
4、在所给的链接中https://www.runoob.com/python3/python3-basic-syntax.html中学习了一些Python的基础知识,比如读取文件、在文件中写一些东西。2、学会了使用jupyter notebook来编写代码,以及在终端中打开jupyter的方法,需要做miniconda所创建的Python环境中打开。3、学习了如何在jupyter notebook中打开所需要的文件,即在进入环境后,jupyter notebook+文件所在的路径。
2024-07-17 19:48:23 106
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人