- 博客(12)
- 收藏
- 关注
原创 大模型学习-python基础day2
一.浮点数类型使用时候可能出现微小误差,可以通过decimal解决二.布尔类型布尔变量只有True和Falsebool是int的子类,True和false可以数字相加三.字符串string用引号括起来的都是字符串,其中的引号可以是单引号,也可以是双引号,可以使用反斜杠\转义特殊字符。也可以使用三个引号表示多行字符串,三个引号允许一个字符串跨多行,字符串可以包含换行符,制表符等其他特殊字符intern机制:Python 解释器在编译时会对满足特定条件的字符串自动进行驻留。
2026-04-04 21:54:21
219
原创 一.大模型学习-python基础Day1
不管在程序什么位置,使用的位于这个范围内的整数都是同一个对象。在哪存的数据区中,会为变量分配存储空间来存放变量的值,这个内存空间的地址对应着变量名称,所以在程序中可以通过变量名称来区分和使用这些内存空间。在python中,变量就是变量,他没有类型。这里的数据类型指的是变量指的内存中存的数据的类型。python中的变量不需要声明,每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。type()不会认为子类是一种父类类型,instance()会认为子类是一种父类类型。可变类型:列表,字典,集合。
2026-03-31 22:32:02
16
原创 Transformer入门基础
时序关系:时序关系是指事件或操作在时间轴上的先后顺序和相互关系,它描述了“什么在什么之前发生”、“什么与什么同时发生”等时间维度上的逻辑联系,是理解序列数据和设计时序系统的基础概念。帮我们去整合特征,让平平无奇的特征输入后,输出一个楞次分明,有特点,能让模型学的更加好的特征。2.对长序列处理能力太有限了,它对早期信息的记忆能力会显著下降。多头注意力机制 multi-headed机制。内积为0表示没关系,内积越大关系越好。1.它本质是串行的,训练速度很慢。q,k,v是怎么来的呢?W初始随机的,他会更新的。
2026-02-11 21:50:35
284
原创 吴恩达机器学习作业——了解numpy
1.返回一个元组,表示数组在每个维度上的大小。3.每个元素=对应维度的元素个数。2.元组的长度 = 数组的维度数。
2026-01-18 13:25:02
150
原创 吴恩达机器学习作业(一)
6.调用computer-model-output函数绘制输出。1.创建x和y的训练集,讲数据存放在numpy中。学习实现f w,b基于单变量的线性回归。2.训练例子的数量m。以下是可能遇到的符号。
2026-01-16 17:59:51
232
原创 吴恩达机器学习自用(四)
将多元线性回归和特征选择的思想结合起来,提出了多项式回归,他可以让曲线或者非线性函数拟合到你的数据中。一.多特征Multiple features(variabels)有时候可以通过转化或者把原始特征进行组合,来设计新的特征。选择或者设计正确的输入特征是使算法有效工作的关键步骤。在平时训练过程中要善于学会动态调整学习率!用于来查看多少次迭代后,梯度下降开始收敛。拥有多个输入特征x1,x2,x3....向量化的方法在梯度下降中的应用。三.多重线性回归的梯度下降。用numpy来编写矩阵。五.选择学习率的影响。
2026-01-08 21:30:30
274
原创 吴恩达机器学习自用(三)
用于找函数趋向最小时,参数的值。不止可以用于成本函数,也可以用在其他函数。本质就是不断迭代参数来找到最接近最小值的参数。注意⚠️:当使用线性回归的平方误差代价函数时,此时代价函数是一个下凹的曲面,此时最小值只有一个而非多个。w和b的更新注意⚠️:不可以让w的改变影响到b的改变,反正也一样。所以w和b要同时更新。学习率:控制下坡时的步子的大小,即根据梯度下降的方向所走的步伐的大小。学习率大小的设置对参数更新的影响。其他情况可能具有多个局部最优。四.线性回归的梯度下降。学习率也可以动态调整。
2026-01-08 15:25:34
267
原创 吴恩达机器学习自用(一)
它是输入到输出的映射算法,即学习输入到输出或x到y的映射。监督学习的关键特征是你给学习算法提供包含正确答案的示例,这里的正确答案是指给定输入x的正确标签y。通过算法的学习最终可以在没有输出标签情况下,仅仅凭借给出的输入就能给出相当准确的预测或猜测。1.Regression(回归算法):示例Housing price prediction。数据只有输入数据x,没有对应的输出标签y,算法要在数据中找到某种结构,模式或者有趣的东西。两种主要类型——监督学习和无监督学习。监督学习是最常用也是发展和创新最多的领域。
2026-01-07 16:15:06
246
原创 数组——二分法
中间值在target右边,由于区间是左闭右闭,而mid所在值一定不等于target,所以接下来搜索的区间一定不包含mid。//由于右边是开区间,所以不需要搜索numsize位置,所以right可以等于numsie。1.在数组里面寻找target,寻找成功返回其下标;查重不成功,则返回-1;//left == right时候,由于区间是左闭右开所以不合法。left == right时候,由于区间是左闭右闭所以合法。a.先看区间是左闭右开/左闭右闭/左闭右开。对应leetcode 704题。
2025-01-12 14:29:43
286
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅