自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 NLP复习3,手撕多头attention

【代码】NLP复习3,手撕多头attention。

2024-03-19 20:23:06 265

原创 NLP复习(二)

adam优化器:主要参数,β1,β2,α。α是学习率,不用解释。β1和β2两个参数是控制两个计算项比例的。可以看到β1作为t-1步变量的系数,1-β1作为t步变量的系数。β1越大,t-1步变量做出贡献越大,也就是优化器调整学习率时候更注重历史信息。β2同理。也就是这两个系数越大,调整学习率时候越注意历史信息。适用于不稳定的目标函数。

2024-03-10 22:56:53 194

原创 NLP复习(一)

Relu激活函数:|

2024-03-07 22:54:16 233

原创 RNN的原理与使用

当初学RNN的时候,被各种公式原理讲解弄得云里雾里。其实很简单RNN中,有几个变量,一个h和一个x。x是当前的输入。比如我们输入一个句子序列“我真牛逼”,这里的每一个字对应一个x。四个字代表四个时间步的输入。而隐藏层h是由上一个时间步的h和当前时间步的x计算得到的。这个计算也很简单,就是把当前时间步的x和上一步的h分别经过全连接层运算后相加。也就是y=wx和h=wh的结果加起来,作为当前时间步的h。然后下一个时间步的h也是重复这个过程。初始化h_0=0比如 我真牛逼这个输入。

2024-02-26 09:46:09 341

原创 NLP新词发现

熵,表示不确定性,这里要计算每个词的左右熵,就是对于一个词,计算该词左边位置的熵和右边位置的熵。熵越大,说明该词左右两边变化越多,该词是一个词语的可能性越大。1.点互信息-表示凝固度。凝固度越大,说明该字组合是一个词的可能性越大。W表示几个字组成的一个组合出现的频率,C表示组合中的每个字。该值越大,W是一个词的可能性越大。

2024-02-20 14:25:58 365

原创 机器学习贝叶斯算法

基本前提:输入空间X,输出空间Y。训练集T={(x,y)}中的样本由P(X,Y)独立同分布产生。这里很多人在学概率论的时候可能不知道什么叫 独立同分布。这里独立的意思是每次抽样互不影响。好比掷骰子,每次掷骰子互不影响。同分布是指每次抽样的样本服从同一个概率分布。朴素贝叶斯做出了一个比较强的假设,即公式:特征向量X为N维时,p(X=x|Y=y)=P(X(第一个位置)=x1|y)P(X(第二个位置)=x2|y)…*P(X(第N个位置)=xn|y)

2022-10-08 21:02:50 407 1

原创 自然语言处理学习(1)一部分概率论知识

从今天开始学习自然语言处理方面的知识。在这里做一些学习的记录。

2022-10-08 19:24:30 259

原创 阿里云天池大赛工业蒸汽预测学习(3)

最近开始了本赛题特征工程部分的学习**概念:**特征工程就是从原始数据提取特征的过程,这些特征可以很好的描述数据,并且利用特征建立的模型在位置数据上的性能表现可以达到最优流程1.去掉无用特征2.去除冗余特诊,利用存在的特征,转换特征,内容中的特征以及其他数据源生成新特征3.对特征进行处理赛题部分:异常值分析 plt.figure(figsize=(18,10)) plt.boxplot(x=train_data.values,labels=train_data.columns) plt.

2022-03-18 15:28:26 1606

原创 阿里云天池大赛工业蒸汽预测代码学习(2)

#查看异常值的代码def find_outliers(model,X,y,sigma=3): #predict y try: y_pred=pd.Series(model.predict(X),index=y.index) except: model.fit(X,y) y_pred=pd.Series(model.predict(X),index=y.index)#用模型预测 resid=y-y_pred#计算残差

2022-03-09 17:28:11 1746

原创 案例天池云大赛工业蒸汽预测代码学习

#获取异常数据的代码import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom scipy import statsfrom pandas import Series,DataFrameimport warningsfrom sklearn.linear_model import Ridgefrom sklearn.metrics import mean_squ

2022-03-08 17:16:31 1029 2

原创 提升树算法实例

按照如图拟合一颗回归树。一直觉得书上的话语说的不够通俗,可能会让很多刚入门的同学看不懂(我自己是这样),现在看明白了记录一下。首先初始化fx0:选择决策的最优切分点s,由优化问题给出。s的取值区间为为[1.5,9.5]这里对于每一个s的取值,求出对应的m(s),在选取使平方误差最小的s作为切分点,计算c1和c2得到了f0x。用此时得到的模型求残差得到残差表。接下来书中说的是用残差拟合回归树,一开始看不明白这句是什么意思。其实就是把残差当作第一个图中的y,再重复进行上述步骤,得到新的c1.

2022-03-01 15:31:27 112

原创 力扣:110 是否为AVL树

检查是否为平衡二叉树,其中一个答案错误反思class Solution {public: bool isBalanced(TreeNode* root) { if(root==nullptr)return true; return abs(height(root->left)-height(root->right))<1&&isBalanced(root->left)&&isBalanced(root

2021-11-14 21:08:36 410

安装hadoop用的软件

没什么好介绍的

2022-12-15

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除