- 博客(4)
- 资源 (4)
- 收藏
- 关注
原创 深度学习笔记之五——tensorflow的多值离散值特征的embedding
Embedding embedding是取代onehot的比较好的一种方式,与NLP中的word embedding有所区别,我们这里的embedding,仅仅是因为该特征unique值过多,onehot产生的矩阵过宽,所以取而代之使用embedding来减少维度。单值 回到题目,对于一般情形下的离散特征,我称之为单值离散值特征,如下: ...
2019-04-24 17:05:53 4714 1
原创 深度学习笔记之四——feature_column
1、numeric_column —— 代表连续数值类型的特征列。2、bucketized_column——将连续数值分箱,如:输入(1,2,3,4,5)按照(0,34,5)两个区间分箱,分箱成为(0,0,0,1,1)的onehot形式,即最终结果为:),( [1,0] #1 [1,0] #2 [1,0] #3 [0,1] #4 [0,1] #53、categor...
2019-04-22 08:51:06 1511
原创 深度学习笔记之三——tensorflow实现wide&deep模型
wide&deep模型原理十分简单,说白了就是wide类模型与deep类模型的组合(借鉴google paper,但是选用模型不同)。提出两个问题:1、什么是wide类、deep类?wide类模型一般指的是复杂度不高的线性模型,以LR最为常见。deep类模型一般指的是复杂度比较高、拟合数据能力强的神经网络,boosting、bagging类模型应该也是可以的。2、为什么...
2019-04-19 17:08:44 2682 4
原创 推荐系统学习笔记之七——大数据量下相似item计算(LSH)
在推荐系统中,我们不可避免的会遇到相似物品推荐的问题,这时候我们首先会想到去计算所有items互相间的相似度。而当我们去一个个计算iem与item之间的相似度(如余弦相似度)时,我们会发现这时一个时间复杂度至少O^(n*n*m)的问题,对于n个item中的每一个item,都要计算它与其他所有item的向量积(向量长度即user个数为m)。 这个时间复杂度是绝对无法接受的。于是前辈们实现了...
2019-04-04 23:51:11 1463
xiaoshuo_03_6-6.zip
2019-06-11
sparkstreaming2.3_kafka0.8_jar包集合
2018-04-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人