自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

降措的博客

人工智能

  • 博客(11)
  • 问答 (5)
  • 收藏
  • 关注

原创 LeetCode 【前缀和】整理

560.和为 K 的子数组 974.和可被 K 整除的子数组 1248.统计[优美子数组] 1371.每个元音包含偶数次的最长子字符串 解题过程 假设 preSum[i] 是数组 A[1]、A[2],...,A[n] 的前缀和,则: preSum[i] = A[1]+A[2] +...+A[i] 数组 A 的子数组A[i,..,j] 可以表示为 preSum[j]-preSum[i-1]。 对于上面几道题来说,通过遍历数组 A 生成 preSum 数组,同时结合哈希表,可以在O(n) 时间复杂度内解决。

2020-05-27 20:02:38 414

原创 Python 异常

Python 异常 工作过程 while true: try: x = int(input("Please enter a number:")) break except ValueError: print('非法数字') try 语句的工作原理如下: 首先执行 try 子句; 如果没有异常发生,则跳过 except 子句并完成 try 语句的执行; 如果在执行 try 语句时发生了异常,则跳过该子句剩下的部分,然后进行下面的异常匹配; 找到匹配后,程序进入对应的 except 子句中执

2020-05-27 10:24:45 148

NLP面试题整理

1. LSTM中各模块分别使用什么激活函数,可以使用别的激活函数码? 2. Seq2Seq在解码时,有哪些常用的方法? 3.Seq2Seq加入注意力机制是为了解决什么问题?为什么选用双向循环网络? 假设编码器的输出为C,编码器第一时刻输出为y1=f(C)y_1=f(C)y1​=f(C),第二时刻输出为y2=f(C,y1)y_2=f(C,y_1)y2​=f(C,y1​),可以看出无论生成什么单词时,...

2019-09-04 11:12:40 698

原创 TfidfVectorizer中IDF处理细节

IDF计算:log((m+1)/(n+1))+1,分母和分子均进行了平滑,而且最后结果加上了1,防止IDF为0的词汇被完全抑制。

2019-07-02 21:31:13 442

原创 pytorch用到的函数记录一下(不定更新~)

""" 返回上三角矩阵 diagonal \in [0, min(d_w, d_h)-1] diagonal表示对角线轴,为0表示主对角线(i,i)。大于0往上走,小于0往下走。最后结果会存储在out里面。 当out不等于None时,torch.triu(input, diagonal=0, out=None) is out,貌似用C语言实现的,类似指针的引用 """ torch.triu(in...

2019-07-02 14:28:15 115

原创 pytorch_bert_pretrained代码学习

配置文件 bert base { "attention_probs_dropout_prob": 0.1, "hidden_act": "gelu", "hidden_dropout_prob": 0.1, "hidden_size": 768, "initializer_range": 0.02, "intermediate_size": 3072, "max_pos...

2019-07-02 14:27:23 2797

原创 花书学习——深度模型中的优化

8 深度模型中的优化 8.1 学习和纯优化有和不同 机器学习经常是间接作用的 我们关注某些度量PPP,其定义于测试集上并且可能是不可理解的。因此,我们只是间接优化PPP。我们希望通过降低代价函数J(θ)J(\theta)J(θ)来提高PPP。纯优化问题最小化目标本身。 通常 ,代价函数可写为训练集上的平均,如J(θ)=E(x,y)≈p^dataL(f(x;θ),y)J(\theta)=E_...

2019-06-14 21:51:13 253

原创 花书学习--深度学习中的正则化

7 深度学习中的正则化 机器学习中的一个核心问题是设计不仅在训练数据上表现好,而且能在新的输入上泛化好的算法。在机器学习中,许多策略被显式地设计来减少测试误差,这些策略被统称为正则化。 Q:为什么需要正则化? 在实践中,过于复杂的模型族不一定包括目标函数或真实数据的生成过程,甚至也不包括近似过程。我们很难知道数据的生成过程,所以很难确定模型族是否包含数据的生成过程。 如图像、视频文本等,本质上...

2019-06-13 09:02:08 385

原创 使用词向量时如何对数据进行预处理

在使用词向量时,不要使用常用的预处理过程如停用词移除、词干提取等 尽可能地使单词更加得靠近词向量 在某些场景下,如情感分类,标点符号、大小写也可能会包含有用的信息 对于特定的任务,如情感分类来说,一些特殊字符如表情符号往往含有重要的信息,因此不要随便删除 在使用词向量时,要遵循训练词向量时所进行的预处理操作,如谷歌预处理词向量时对数字用"##"替换,训练glove twitter embeddi...

2019-06-13 08:57:48 859

转载 机器学习之AUC

深入理解AUC AUC是什么 auc是roc曲线的面积,常用来评价二分类系统的好坏。 AUC如何计算 对于二分类问题,预测模型会对每一个预测样本一个得分p,然后选取一个阈值t,当p&gt;tp&gt;tp>t时,样本预测为正,当p&lt;=tp&lt;=tp<=t时样本预测为负。根据样本自身的标签值和模型预测的标签值,我们可以把样本划分为四个部分。分别是...

2019-06-11 16:18:36 3757

原创 花书学习--深度前馈网络

6. 深度前馈网络 6.0 序言 前馈网络 目标:近似某个函数f∗f^{*}f∗ 组成模块:输入层、隐藏层、输出层 模型输出和模型本身之间没有反馈连接 产生背景 传统的线性模型如逻辑回归、线性回归的表达能力有限。为了扩展线性模型来表示xxx的非线性函数,我们可以不把线性函数直接作用在xxx本身,而是作用到xxx的非线性函数ϕ(x)\phi(x)ϕ(x)上。我们可以认为ϕ\phiϕ代表了xxx的...

2019-06-06 21:21:27 229

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除