自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

红豆的博客

this is my blog

  • 博客(13)
  • 收藏
  • 关注

原创 jieba分词原理

采用什么原理如何实现

2020-01-28 20:05:25 186

原创 条件随机场CRF

一、是什么问题,背景是什么二、如何解决,解决的思路,原理2.1CRF的特征函数从特征到概率2.2CRF权重学习2.3 公式的含义三、CRF和HMM的关系四、CRF分词和脉络流程...

2020-01-28 20:03:07 106

原创 seq2seq模型构建过程 API

encoder步骤:Encoder:input_sequences ----> (RNN) ----> C(Cell State)decoder步骤:Decoder:C + 结合时刻i的target ----> (RNN) ----> 预测时刻i+1的target重点:训练过程decoder部分的输入是target预测过程区别:decoder的输入是上一时刻的输...

2020-01-26 21:52:59 245

原创 聊天机器人模型

1. 基于检索技术的模型2. 基于生成式模型3. 混合模式

2020-01-19 12:35:20 582

原创 NLP的四大类任务

具体包括:

2020-01-19 11:02:49 896

原创 tensorflow API 参数记录

一、x_train处理流程:文本->jieba分词->->去除停用词->learn.preprocessing.VocabularyProcessor(将句子中的词用数字id映射)-->word_embedding;1)cnn模型之前的word_embedding输入处理:word_vectors = tf.contrib.layers.embed_seque...

2020-01-16 12:06:45 281

原创 transformer模型

一、模型提出的背景,现有模型的不足原来的RNN模型中,通过输入一个序列,再输出一个序列,序列的输出是有先后顺序的,说明RNN不能被并行化;RNN不能并行,CNN可以,但是CNN不能捕捉长句子的上下文,于是有了self-attention。二、模型改进的核心点在哪里transformer与bi-rnn有同样的能力,每一个输出都看过整个输入序列但是,输出的序列是同时计算的;关键...

2020-01-13 16:30:21 654

原创 数据结构面试题

1.给定一个数组,它的第 i 个元素是一支给定股票第 i 天的价格。 如果你最多只允许完成一笔交易(即买入和卖出一支股票),设计一个算法来计算你所能获取的最大利润。2. 金字塔最小路径之和:给定一个金字塔形状的二维数组,找出自顶向下的最小路径和。每一步只能移动到下一行中相邻的结点上。1. 冒泡排序算法(排序算法)、手写快排,讲原理,最好、最坏时间复杂度、空间复杂度2 写一个...

2020-01-11 10:49:57 137

原创 面试被问到的题目

1. 电商:1)有序、无序数据如何预处理2)如何观察数据,为了干什么3)如果性能无法提升,该如何调整模型呢?4)如何进行特征选择?5)一个完整的工作流是怎样的2. 金融风控:1)除了网格搜索,还有哪些调参方法?2)如果性能无法提升,该如何调整模型呢?3)RF和xgboost哪个更容易过拟合4)RF和xgboost哪个运算速度更快5)xgboost如何防止过...

2020-01-07 17:33:10 140

原创 python冒泡排序算法原理与实现

一、冒泡排序算法原理这个算法的名字由来是因为越小的元素会经过交换慢慢“浮”到数列的顶端。核心思想是:通过双层循环遍历,每次比较两个数,如果他们顺序错误(大于或者小于),那么就把他们位置交换。二、代码实现def bubble_sort(b): if(len(b)<2): return b for i in range(0, len(b)): ...

2020-01-05 13:16:19 252

原创 python快排算法原理与实践

一、快排算法原理快排算法采用了分而治之的策略。它的基本思想是:通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分所有数据都要小,然后再按照此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。步骤:1)在数列之中,选择一个元素作为“基准”(pivot),或者叫比较值;2)数列中所有元素都和这个基准值进行比较,如果...

2020-01-05 11:07:49 150

原创 逻辑回归模型公式推导

2020-01-04 12:29:56 257

原创 常见面试题--机器学习篇

传统的机器学习算法:SVM,LR,softmax,决策树,随机森林,GBDT,xgboost,adaboost,bp神经网络、朴素贝叶斯这些都必须自己手推一次或者多次;深度学习方面:CNN、RNN、LSTM、常用激活函数(tanh、relu等)、adam优化函数、梯度消失原理或者结构应该能手画出来。nlp方面:强烈建议tf-idf、textrank、Word2vec、注意力机制、trans...

2020-01-03 17:33:06 397

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除