自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 [学习笔记]神经网络

因为假设没有激活函数,神经网络会退化成单层的矩阵运算,激活函数确保它有复杂的表达能力.梯度下降法会陷入局部最优解,但由于神经网络参数量较大,故不容易出现这种情况。中间层神经网络会自主学习到重要的信息,表达能力增强.学习率较小会走得慢,学习率太大会震荡不达到最优解.为什么要有激活函数?

2024-08-08 13:38:47 119

原创 [学习笔记]大语言模型

supervised Fine-Tuning:提供大量的用户问答数据(有标注的数据,表明应当如何回答),使得模型理解需要完成的任务(回答问题) -> 问题在于,一个问题有很多种回答方法,而此时会被标准答案框定,缺少灵活性。LLM(large language model,大语言模型)的原理是基于既往的数据学习,在一次生成任务中按照前一个生成的词一步一步预测下一个词(预测下一个token)但是,大语言模型可能会胡说八道,会产生误导,产生坏的影响,甚至被当成训练数据进一步恶化模型表现。

2024-08-07 23:37:23 270

原创 一次相对完整的K-means聚类流程

第三聚类:聚类中心(121.2,18.6,43.6),五个点。第一聚类:聚类中心(124.5,20,44.5),两个点。第二聚类:聚类中心(121,17,41.7),三个点。

2024-07-17 16:25:49 606

原创 [个人学习博客]时间序列分析的统计检验

根据LB检验的结果,在延迟阶数[4,8,16,32]的情况下,X1序列P值均小于0.05,拒绝H0,接受H1,差异有统计学意义,认为该数据不是随机的。如果一个序列是白噪声(独立同分布的随机数据),那么进行时间序列分析是无意义的。时间序列分析主要包括三个检验:白噪声检验,平稳性检验和时间序列数据的自相关系数和偏自相关系数的分析。H1:延迟期数小于或等于m期的序列之间存在相关性(序列不为白噪声)H0:延迟期数小于或等于m期的序列之间相互独立(序列为白噪声)常用的检验方法为LB检验(Ljung-Box检验)

2024-07-15 12:22:43 565

原创 [个人学习博客]时间序列分析基本流程

(1)根据时间序列的散点图、自相关函数和偏自相关函数图等识别序列是否是非随机序列,如果是非随机化序列,则观察平稳性(先判断该时间序列有没有分析趋势的价值,如果为随机化序列,分析无意义,因为数据波动均由随机化误差导致)时间序列的变化受到:长期趋势、季节变动、循环波动(周期波动)和不规则波动(随机波动)的影响,这导致时间序列分析主要包括确定性变化分析和随机性变化分析。时间序列分析的原理:根据时间先后,对同样的对象按照等时间间隔收集的数据进行的分析(数据为离散数据)(6)利用已通过检验的模型进行预测。

2024-07-14 01:33:09 150

原创 [个人学习博客]机器学习的用途

机器学习可以用于推荐系统(相似推荐,特征计算相似),语音识别(贝叶斯),CV(比如CT片子辅助诊断),自动驾驶等等,一切可以从既往数据中寻找到规律的方向均可能存在应用。比赛偏向于效果好,但是不一定能复现;学术偏向于理论,不一定能落地;工业偏向于应用,但是由于成本导致应用受限。机器学习分为三个地方的应用:比赛,学术,工业。AI>机器学习>深度学习(黑箱)

2024-07-13 01:08:07 103

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除