自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 深度学习章节:模型的选择与训练.交叉验证.测试集, 诊断偏差与方差,正则化与偏差方差,建立基准性能水平

图里是 60%/20%/20%,实际项目中,数据量小的时候可以用 70%/15%/15%,数据量大的时候甚至可以用 98%/1%/1%,(Regularized Linear Regression),核心是如何用正则化项控制模型的偏差与方差,解决过拟合 / 欠拟合问题。现象:J_train​ 缓慢上升,J_cv​ 持续下降,两条线在中间区域距离最近,且J_cv​达到最低点。现象:J_train​ 非常低(模型几乎完美拟合训练数据),但 J_cv​ 很高,两条线差距很大。

2026-04-25 13:08:52 435

原创 深度学习:训练细节,Sigmoid激活函数的替换方法,选择激活函数,为什么需要激活函数,多类别,Softmax回归(多类别概率方程,多类别代价函数方程),带有Softmax输出的神经网络, 等内容.

对于一个函数 F 其中内含的自变量可以有x,y,z,根据自变量的不同形式我们可以得出不同的函数F的方程式,为了方便理解x,y,z是函数F的自变量,因此我们可以使用 F(x,y,z) 的形式来表示函数,根据不同的自变量的大小我们可以用 u,v,p 来分别表示函数 F(x,y,z)内部各个自变量的对应关系,例如:u=3x+1 , v=-2y+3 , p=5z-1 来对各个自变量进行指定。对于损失和代价的定义,我们在前面的逻辑回归和神经网络中学过对数似然损失和二元交叉熵的内容,我们可以处理不同的样本情况。

2026-04-19 11:15:03 406

原创 深度学习:代码中的推理,TensorFlow中的数据,构建神经网络,单层前向传播,前向传播的通用实现,神经网络的高效实现方式,矩阵的乘法,矩阵乘法代码(matmul的使用),TensorFlow的实现

上述图片的补充内容:在神经网络之间的特征值的计算过程中最开始我们使用的点乘可以的出计算结果,当一个特征值为单行单列时,由于最初都是以列的形式来进行点乘会相对比较麻烦,因此我们可以。该处展现的是神经网络在代码中的体现,根据我们前面所学的神经网络和sigmoid函数在python中的实际代码编写。用 纯 NumPy 代码模块化实现前向传播,核心是把神经网络拆解为可复用的函数,直观理解层与层之间的计算逻辑。上图中的两段代码运行后的结果相同但是对于一个程序而言,前一个使用循环遍历和点乘的方法得出的结果,但是。

2026-03-29 10:08:16 396

原创 深度学习:神经元与大脑的工作原理,需求预测,神经网络层,更复杂的神经网络,推理:预测与前向传播(算法)

隐藏层中的各个神经元而言我们根据不同的激活值和不同的权重和偏置可以计算出各个不同的输出结果我们将隐藏层中得出的结果传递到输出层中进行输出。对于多个隐藏层而言,上一层的结果值(激活值)作为下一层的输入值由于对于各个隐藏层而言存在不同的特征值。所谓的更复杂的神经网络指的是有更多隐藏层的神经网络,因此该部分内容与我们前面所学的内容相差不大,输出(Output):a:表示 “该商品成为畅销品(top seller)” 的概率。数据从输入层流入,经过每一个隐藏层的计算,最后从输出层输出。

2026-03-22 15:12:27 548

原创 机器学习补充:正则化的线性回归和正则化的逻辑回归

特征标准化:和线性回归一样,正则化惩罚参数绝对值,特征尺度不同会导致惩罚不公平(比如尺度大的特征参数被过度惩罚),因此必须标准化;模型评估:用准确率和分类报告(精确率、召回率、F1)评估二分类效果,正则化模型的测试集准确率通常更高(泛化能力强);若想兼顾两者:用penalty='elasticnet'(弹性网),需指定l1_ratio(L1 占比)。同样不对截距项θ0​(偏置)做正则化(仅惩罚特征对应的权重θ1​,θ2​,...θn​)若特征多且大部分有用:选L2 正则化(默认),仅压缩参数,不剔除特征;

2026-03-22 15:00:23 174

原创 机器学习(决策边界,逻辑回归的成本函数,简化后的逻辑回归的成本函数,梯度下降实现,过拟合问题,解决过拟合,带正则化的成本函数)

因此当我们以1为真值时将1代入进上述方程得出的结果即为当y=1时的损失函数,同理当0为真值时将y=0代入上述方程得出的结果为当y=0时的损失函数。由此我们便得出了一个。由于f(x)= g(Z) 因此我们需要对比的值即为g(z)的值的大小,将我们得出的g(z)代入进图像中再根据决策边界来确定其二元的类别。当真实标签 y(i)=0 时损失函数:L(fw,b​(x(i)),y(i))=−log(1−fw,b​(x(i)))损失函数:L(fw,b ​(x(i)),y(i))=−log(fw,b​(x(i)))

2026-03-14 16:55:11 398

原创 机器学习章节总结:向量化,多重线性回归的梯度下降,特征缩放,检查梯度下降是否收敛,选择学习率,特征工程,多项式回归,动机(二元分类,逻辑回归前言),逻辑回归

对于处在分界线左侧的数据我们将其归类为0类(具体分类根据图像中的二元类别来进行确立,该处默认0在左侧)而处在分界线右侧的数据我们将其归类为1类。上述的线性回归模型中若是有一个特殊值(特例)使得我们将已经拟定好的假设函数修改并向右偏移后该假设函数对于真实的数据预判将会出错,

2026-03-08 16:57:59 405

原创 三大库内容的知识点补充

使用set_index语法后正常情况下由于重复了因此其行索引的名称不会显现,因此我们可以使用语法drop=False来使得行索引名称显现。若是出现数组一的行数比数据二的行数要少的情况下,一般以数组一的行数作为标准,将数组二多出来的行数进行删去后在合并。因此我们调换内容后就可以按照上述的原方法对所需数据进行精准调用。由于我们可以使用多个行索引(level),tolist()将数组内容转化为列表的语法。由上述代码我们可以得知。

2026-02-26 13:28:09 303

原创 numpy章节的补充

我们使用切片的操作来对数组的行列进行交换操作,其中在我们交换的过程中我们 [ ] 号内部的数据指的是要交换的行或列的位置(下标)在numpy中我们有多种方法可以实现数据的复制但是对于copy语法而言其作用并不相同。对以一个指定的数组我们可以对其进行指定选取,指定范围内的数据为我们所定内容。numpy-copy与view。numpy-clip裁剪语法。

2026-02-15 18:40:54 41

原创 代价函数,矩阵的计算

为了更好的理解代价函数我们可以使用空间立体图形来对代价函数进行描述,对于一组数据而言我们根据其假设函数可以得出其代价函数,我们将所得出得代价函数集合形成一个图形,其类似于一张网,上述的两幅图为假设函数图和一张登高线地形图,对于等高线地形图而言我们可以看作是将上方的立体图形由三维变为二维(即将其压缩,拍扁)形成的,对于。:与正常的乘法交换律不同,对于常数而言乘法交换律只是换了个位置,其本质并没有发生改变,但是在矩阵中不是这样的,,例如上述的A11表示的是矩阵中的第一行第一列的数。

2026-02-06 11:39:32 572

原创 pandas-DataFrame全内容,数据的导入导出,缺失值的处理,数据类型的转换,数据变形,数据分箱,时间顺序处理,分组聚合部分笔记总结

category 指的是分类的意思,即将我们数据内容中出现的数据进行分类,在该处gender表示的是性别的意思(课中的gender内部有male和female两种类别),在转化了category的类型后,输出内容会帮我们总结其数据中所含有的数据类别。labels的作用为: 若指定数据内部的数据分别满足bins中的区间,那么按照不同的区间我们给其一个特定的数据进行返还,即按照顺序返还labels中的数据。bins=n,分成n段区间 且分成的n段区间的端点数(两区间的交界处的数)即为平均分后的数。

2026-02-01 16:01:09 665

原创 pandas-series的属性

对于索引而言,我们。

2026-01-23 11:16:36 283

原创 python 数据分析 (numpy部分)(包含ndarray的创建,属性,性质,数据类型,矩阵,运算。numpy-索引与切片,-基本数学函数,-统计函数,-比较函数,-排序函数)

语法形式一般为:np.语法名(数组)。1.sum 求和语法。

2026-01-17 19:45:25 1242

原创 python数据分析(matplotlib部分)(包含基本绘图,设置显示中文,解包字典,列表推导式,字符串格式化的补充内容)

family:指定字体为。

2025-12-22 18:42:14 918

原创 变量与函数(行为)的类型注解

在我们使用pycharm编写程序的过程中我们往往会定义属于我们的函数内容例如:函数func,同时我们还会接受一个参数data 即:def func(data) 对于我们定义函数的过程中pycharm并未对data进行提示说明,在我们使用通用语法的过程中pycharm往往会对我们编写的程序进行猜测与补充。我们在编写程序的过程中往往为了省时会使用Tab键来直接将pycharm给我们的提示补充填入,在程序编写的过程中我们使用程序自带的函数语法时pycharm可以确定我们所需要的数据类型因此。

2025-12-09 16:57:20 349

原创 JSON数据格式的转换,pyecharts第三方可视化图包,基础地图的使用,柱状图的使用和反转x和y轴,sort的引申(指定排序),图表内的时间线的设置与自动播报

在进行数据转化的过程中 中文数据 由于转化会根据ASCII码表进行转化,因此在输出的过程中是以改变后的ASCII码值进行输出的。该部分内容不做过多解释。只提供一个pyecharts的安装方式和对pyecharts中的图的查看方式。在列表章节中学过我们可以利用sorted垒对数据容器进行排序,但是在目前我们程序编写的过程中往往。我们可以将不同编程语言中的不同内容转换为字符串的形式再进行文件的交换。该语法的作用是:将python的数据转化为json数据。我们的数据同样需要利用不同的时间线对其进行记录。

2025-11-30 20:50:04 602

原创 近期一周对于python的学习总结(异常的捕获与传递,模块,python包)

对于一个模块我们可以用 __all__=[] 来限定模块的输出内容,当我们调用模块的时候的形式为import*时,1.若import和from同时存在,其中import即调用的意思,调用from后的模块名内的内容。import的作用将被改变为调用from调用的文件中的指定功能(函数,类,变量),使用此方法在后续。与前面的模块调用相同,我们可以通过from来对python包进行调用,且在from语法中我们可以。同样的我们可以使用__all__来限制模块的调用,但是与模块不同的是,

2025-11-21 22:00:00 1566

原创 近期一周对于python学习的笔记总结(字符串,字典,序列,函数补充,文件的常用操作)

我们了解在函数中我们定义的函数要具有返回值(除非说明是不返回类型),可对于不同的函数我们希望有多个返回值,因此在python中有这样一段语法: return 返回值1,返回值2 其中两个返回值中间用“,”进行分隔,同时在接受的过程中我们也要用连个变量对其进行接受。是一个一次性的函数。字典当中由于其不可重复性,在我们新增元素时使用语法: 字典[key]=Value 时若字典当中未有该key那么就在其后边新增一个key,但是如果字典当中有该key那么就将新加入的key的值替换原字典中的key值。

2025-11-16 17:00:34 606

原创 python当中用于存放记录数据的方式

我们用列表来存储一系列的数据,在python当中列表可以改变列表内的数据内容,可以通过增加列表后缀来达到不同的效果例如index来寻找指定数据的下标,从而使我们的数据获取与添加删减变得更加方便高效。与C语言的字符串作用不同在python当中我们的字符串本身就具有存储数据的作用因此我们可以通过访问下标的方式来读取字符串的内容,可以将其视为一个数组,我们同时可以利用与列表和元组相同的添加后缀的方式来控制字符串的内容。对于以上三种存储数据的方法我们主要以通过下标的方式来控制其中的数据。

2025-11-07 19:21:17 172

原创 近期对于python的学习进行思考

我感觉C语言的程序编写过于标准化需要注意的细节很多与python不同虽然说python是基于C语言的一门编程语言但是在编写的过程中我们能清楚的感受到python对于程序标准化的宽松。在python的循环语句for中与C语言的区别较大,python中的for具有遍历变量的作用与C中的指针作用相类似有意思的是对于python的for循环而言我们可以直接将变量放入for循环,循环的次数由变量本身来决定这是与C中指针不同的我们遍历指针要在循环中放入数组的个数要多一步操作进行判断。

2025-11-02 19:04:45 306

原创 指针章节的笔记

注:*p++的作用是读取下一位*p的值,由于我们前面学过对于数组而言是一种特殊的指针,在程序运行的过程当中我们可以将指针直接视为数组因此*p++即读取数组p[]数组的下一位即:若目前读取为p[1],*p++后为p[2]。对于数组与指针的关系:数组是一种特殊的指针不可以改变大小,由于数组与指针的对应关系我们引申出的const,我们利用const来限定数组与函数从而保护数组的值。文字描述:*p即为原变量,我们可以通过改变*p的值来改变原变量的大小,p即原变量的地址。

2025-10-25 08:21:29 211

原创 数组与指针

同时我们了解到对于指针而言指针确定所指明的变量地址,同时也是按照顺序排开,在指针中我们利用“&”该运算符来寻找变量所在地址,同时利用%p来输出变量地址。对于这两者的区别在于一个可以改一个不能更改,但是对于数组来说数组可视为一个不可改变的指针。因此我们可以利用指针和数组来对我们所需要的数据进行筛选,区分。从而使我们更快捷的得出我们所需要的内容以及数据位置所在地。但是对于数组和指针来说我们要确定运用的场景例如以下情景。在我们学习数组中我们知道对于数组而言不可以改变数组的大小,且数组是按照顺序依次排开来。

2025-10-19 19:57:49 112

原创 C语言中函数的调用

而在函数组中我在思考是否存在重复/重叠即相同类型的函数在不同数组之中,同时我们利用这些数组我们可以使得我们的函数代码变得更加的简洁明了,让人更容易去理解代码改进程序的算法。最后在c语言的函数中我们通常在函数的结尾写上return 0;对于学完函数内容后在void的函数类型中翁恺老师讲到对于没有返回值的函数我们可以没有return,这让我想到对于我们最开始的代码编写中我们代码结尾处的return 0 到底返回至哪里(目前只学到c语言函数还不明白)希望能在学习完c语言后能弄清楚这个问题。

2025-10-10 18:31:55 201

原创 对于最近学习c语言的思考

2.在补码当中我们使用进制的规则和等价的方式来进行语义的转换,我认为补码能让我们更快的使计算机进行运算得出结果但对于我们写代码的人而言我们理解的过程中可能会理解错原本代码的意思,所以我在思考能否给个确定的标准使得我们能够准确的读出代码的本身含义(此上为我个人见解本人新学C语言若有说错地方请多多包含)即便补码存在一个unsigned来区分但我还是认为应该给个更为清晰的标准。在最近学习c语言的过程中主要学了c语言中如何利用数学函数和补码内容。

2025-10-05 16:02:11 235

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除