降措-CSDN博客

原创 LeetCode 【前缀和】整理

560.和为 K 的子数组974.和可被 K 整除的子数组1248.统计[优美子数组]1371.每个元音包含偶数次的最长子字符串解题过程假设 preSum[i] 是数组 A[1]、A[2],...,A[n] 的前缀和，则：preSum[i] = A[1]+A[2] +...+A[i]数组 A 的子数组A[i,..,j] 可以表示为 preSum[j]-preSum[i-1]。对于上面几道题来说，通过遍历数组 A 生成 preSum 数组，同时结合哈希表，可以在O(n) 时间复杂度内解决。

2020-05-27 20:02:38 418

原创 Python 异常

Python 异常工作过程while true: try: x = int(input("Please enter a number:")) break except ValueError: print('非法数字')try 语句的工作原理如下：首先执行 try 子句；如果没有异常发生，则跳过 except 子句并完成 try 语句的执行；如果在执行 try 语句时发生了异常，则跳过该子句剩下的部分，然后进行下面的异常匹配；找到匹配后，程序进入对应的 except 子句中执

2020-05-27 10:24:45 159

NLP面试题整理

1. LSTM中各模块分别使用什么激活函数，可以使用别的激活函数码？2. Seq2Seq在解码时，有哪些常用的方法？3.Seq2Seq加入注意力机制是为了解决什么问题？为什么选用双向循环网络？假设编码器的输出为C，编码器第一时刻输出为y1=f(C)y_1=f(C)y1=f(C)，第二时刻输出为y2=f(C,y1)y_2=f(C,y_1)y2=f(C,y1)，可以看出无论生成什么单词时，...

2019-09-04 11:12:40 709

原创 TfidfVectorizer中IDF处理细节

IDF计算：log((m+1)/(n+1))+1，分母和分子均进行了平滑，而且最后结果加上了1，防止IDF为0的词汇被完全抑制。

2019-07-02 21:31:13 454

原创 pytorch用到的函数记录一下(不定更新~)

"""返回上三角矩阵diagonal \in [0, min(d_w, d_h)-1]diagonal表示对角线轴，为0表示主对角线（i,i）。大于0往上走，小于0往下走。最后结果会存储在out里面。当out不等于None时，torch.triu(input, diagonal=0, out=None) is out，貌似用C语言实现的，类似指针的引用""" torch.triu(in...

2019-07-02 14:28:15 129

原创 pytorch_bert_pretrained代码学习

配置文件bert base{ "attention_probs_dropout_prob": 0.1, "hidden_act": "gelu", "hidden_dropout_prob": 0.1, "hidden_size": 768, "initializer_range": 0.02, "intermediate_size": 3072, "max_pos...

2019-07-02 14:27:23 2819

原创花书学习——深度模型中的优化

8 深度模型中的优化8.1 学习和纯优化有和不同机器学习经常是间接作用的我们关注某些度量PPP，其定义于测试集上并且可能是不可理解的。因此，我们只是间接优化PPP。我们希望通过降低代价函数J(θ)J(\theta)J(θ)来提高PPP。纯优化问题最小化目标本身。通常，代价函数可写为训练集上的平均，如J(θ)=E(x,y)≈p^dataL(f(x;θ),y)J(\theta)=E_...

2019-06-14 21:51:13 265

原创花书学习--深度学习中的正则化

7 深度学习中的正则化机器学习中的一个核心问题是设计不仅在训练数据上表现好，而且能在新的输入上泛化好的算法。在机器学习中，许多策略被显式地设计来减少测试误差，这些策略被统称为正则化。Q：为什么需要正则化？在实践中，过于复杂的模型族不一定包括目标函数或真实数据的生成过程，甚至也不包括近似过程。我们很难知道数据的生成过程，所以很难确定模型族是否包含数据的生成过程。如图像、视频文本等，本质上...

2019-06-13 09:02:08 400

原创使用词向量时如何对数据进行预处理

在使用词向量时，不要使用常用的预处理过程如停用词移除、词干提取等尽可能地使单词更加得靠近词向量在某些场景下，如情感分类，标点符号、大小写也可能会包含有用的信息对于特定的任务，如情感分类来说，一些特殊字符如表情符号往往含有重要的信息，因此不要随便删除在使用词向量时，要遵循训练词向量时所进行的预处理操作，如谷歌预处理词向量时对数字用"##"替换，训练glove twitter embeddi...

2019-06-13 08:57:48 870

转载机器学习之AUC

深入理解AUCAUC是什么auc是roc曲线的面积，常用来评价二分类系统的好坏。AUC如何计算对于二分类问题，预测模型会对每一个预测样本一个得分p，然后选取一个阈值t，当p>tp>tp>t时，样本预测为正，当p<=tp<=tp<=t时样本预测为负。根据样本自身的标签值和模型预测的标签值，我们可以把样本划分为四个部分。分别是...

2019-06-11 16:18:36 3788

原创花书学习--深度前馈网络

6. 深度前馈网络6.0 序言前馈网络目标：近似某个函数f∗f^{*}f∗组成模块：输入层、隐藏层、输出层模型输出和模型本身之间没有反馈连接产生背景传统的线性模型如逻辑回归、线性回归的表达能力有限。为了扩展线性模型来表示xxx的非线性函数，我们可以不把线性函数直接作用在xxx本身，而是作用到xxx的非线性函数ϕ(x)\phi(x)ϕ(x)上。我们可以认为ϕ\phiϕ代表了xxx的...

2019-06-06 21:21:27 234

TA关注的人

降措的博客

原创 LeetCode 【前缀和】整理

原创 Python 异常

NLP面试题整理

原创 TfidfVectorizer中IDF处理细节

原创 pytorch用到的函数记录一下(不定更新~)

原创 pytorch_bert_pretrained代码学习

原创花书学习——深度模型中的优化

原创花书学习--深度学习中的正则化

原创使用词向量时如何对数据进行预处理

转载机器学习之AUC

原创花书学习--深度前馈网络

空空如也

<video>无法播放iis7上的mp4视频

H5 <video>无法播放问题

ffmpeg向直播流中插入音频问题

iptables设置白名单时出错

openwrt自启动脚本无法执行wget命令