地大停车第二帅-CSDN博客

原创文本匹配模型ESIM代码逐行解读

用上面的例子，sorting_idx=[1,0,2]按照升序排序返回_=[0,1,2].reverse_mapping=[1,0,2]。输入tensor是[batch,max_length,max_length],mask是[batch,max_length]。sequences_batch[:,:max_length]==0这一句会选择句子序列中前max_length中，所有=0的位置。比如序列[3,2,1]排序得到[1,2,3],那么返回的sorting_idx就是[2,1,0]表示排序结果中。

2024-07-21 10:29:48 1135

原创 NLP复习3，手撕多头attention

【代码】NLP复习3，手撕多头attention。

2024-03-19 20:23:06 718

原创 NLP复习（二）

adam优化器:主要参数，β1，β2，α。α是学习率，不用解释。β1和β2两个参数是控制两个计算项比例的。可以看到β1作为t-1步变量的系数，1-β1作为t步变量的系数。β1越大，t-1步变量做出贡献越大，也就是优化器调整学习率时候更注重历史信息。β2同理。也就是这两个系数越大，调整学习率时候越注意历史信息。适用于不稳定的目标函数。

2024-03-10 22:56:53 290

原创 NLP复习（一）

Relu激活函数:|

2024-03-07 22:54:16 342

原创 RNN的原理与使用

当初学RNN的时候，被各种公式原理讲解弄得云里雾里。其实很简单RNN中，有几个变量，一个h和一个x。x是当前的输入。比如我们输入一个句子序列“我真牛逼”，这里的每一个字对应一个x。四个字代表四个时间步的输入。而隐藏层h是由上一个时间步的h和当前时间步的x计算得到的。这个计算也很简单，就是把当前时间步的x和上一步的h分别经过全连接层运算后相加。也就是y=wx和h=wh的结果加起来，作为当前时间步的h。然后下一个时间步的h也是重复这个过程。初始化h_0=0比如我真牛逼这个输入。

2024-02-26 09:46:09 468

原创 NLP新词发现

熵，表示不确定性，这里要计算每个词的左右熵，就是对于一个词，计算该词左边位置的熵和右边位置的熵。熵越大，说明该词左右两边变化越多，该词是一个词语的可能性越大。1.点互信息-表示凝固度。凝固度越大，说明该字组合是一个词的可能性越大。W表示几个字组成的一个组合出现的频率，C表示组合中的每个字。该值越大，W是一个词的可能性越大。

2024-02-20 14:25:58 489

原创机器学习贝叶斯算法

基本前提:输入空间X，输出空间Y。训练集T={（x,y）}中的样本由P（X，Y）独立同分布产生。这里很多人在学概率论的时候可能不知道什么叫独立同分布。这里独立的意思是每次抽样互不影响。好比掷骰子，每次掷骰子互不影响。同分布是指每次抽样的样本服从同一个概率分布。朴素贝叶斯做出了一个比较强的假设，即公式:特征向量X为N维时，p(X=x|Y=y)=P(X（第一个位置）=x1|y)P(X(第二个位置）=x2|y）…*P（X（第N个位置）=xn|y）

2022-10-08 21:02:50 490

原创自然语言处理学习（1）一部分概率论知识

从今天开始学习自然语言处理方面的知识。在这里做一些学习的记录。

2022-10-08 19:24:30 355

原创阿里云天池大赛工业蒸汽预测学习（3）

最近开始了本赛题特征工程部分的学习**概念：**特征工程就是从原始数据提取特征的过程，这些特征可以很好的描述数据，并且利用特征建立的模型在位置数据上的性能表现可以达到最优流程1.去掉无用特征2.去除冗余特诊，利用存在的特征，转换特征，内容中的特征以及其他数据源生成新特征3.对特征进行处理赛题部分：异常值分析 plt.figure(figsize=(18,10)) plt.boxplot(x=train_data.values,labels=train_data.columns) plt.

2022-03-18 15:28:26 1738

原创阿里云天池大赛工业蒸汽预测代码学习（2）

#查看异常值的代码def find_outliers(model,X,y,sigma=3): #predict y try: y_pred=pd.Series(model.predict(X),index=y.index) except: model.fit(X,y) y_pred=pd.Series(model.predict(X),index=y.index)#用模型预测 resid=y-y_pred#计算残差

2022-03-09 17:28:11 1881

原创案例天池云大赛工业蒸汽预测代码学习

#获取异常数据的代码import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom scipy import statsfrom pandas import Series,DataFrameimport warningsfrom sklearn.linear_model import Ridgefrom sklearn.metrics import mean_squ

2022-03-08 17:16:31 1186 2

原创提升树算法实例

按照如图拟合一颗回归树。一直觉得书上的话语说的不够通俗，可能会让很多刚入门的同学看不懂（我自己是这样），现在看明白了记录一下。首先初始化fx0：选择决策的最优切分点s，由优化问题给出。s的取值区间为为[1.5,9.5]这里对于每一个s的取值，求出对应的m(s)，在选取使平方误差最小的s作为切分点,计算c1和c2得到了f0x。用此时得到的模型求残差得到残差表。接下来书中说的是用残差拟合回归树，一开始看不明白这句是什么意思。其实就是把残差当作第一个图中的y，再重复进行上述步骤，得到新的c1.

2022-03-01 15:31:27 206

原创力扣：110 是否为AVL树

检查是否为平衡二叉树，其中一个答案错误反思class Solution {public: bool isBalanced(TreeNode* root) { if(root==nullptr)return true; return abs(height(root->left)-height(root->right))<1&&isBalanced(root->left)&&isBalanced(root

2021-11-14 21:08:36 494

kenlm的训练模型文件

2024-08-27

安装hadoop用的软件

没什么好介绍的

2022-12-15

怎么把Mindspore训练好的深度学习模型部署到APP中

2022-12-23

训练集数据反带回模型效果很差

2022-11-14

如何使用python将三维数组显示为3D图像？

2022-09-24

TA创建的收藏夹 TA关注的收藏夹

TA关注的人