2019年04月_JAVA技术分享官-乐乐

09月 07月 06月 05月 04月 03月 02月 01月

原创深度学习笔记之五——tensorflow的多值离散值特征的embedding

Embedding embedding是取代onehot的比较好的一种方式，与NLP中的word embedding有所区别，我们这里的embedding，仅仅是因为该特征unique值过多，onehot产生的矩阵过宽，所以取而代之使用embedding来减少维度。单值回到题目，对于一般情形下的离散特征，我称之为单值离散值特征，如下： ...

2019-04-24 17:05:53 4714 1

原创深度学习笔记之四——feature_column

1、numeric_column —— 代表连续数值类型的特征列。2、bucketized_column——将连续数值分箱，如：输入（1，2,3,4,5）按照（0,34,5）两个区间分箱，分箱成为（0,0,0,1,1）的onehot形式，即最终结果为：），（ [1,0] #1 [1,0] #2 [1,0] #3 [0,1] #4 [0,1] #53、categor...

2019-04-22 08:51:06 1511

原创深度学习笔记之三——tensorflow实现wide&deep模型

wide&deep模型原理十分简单，说白了就是wide类模型与deep类模型的组合（借鉴google paper，但是选用模型不同）。提出两个问题：1、什么是wide类、deep类？wide类模型一般指的是复杂度不高的线性模型，以LR最为常见。deep类模型一般指的是复杂度比较高、拟合数据能力强的神经网络，boosting、bagging类模型应该也是可以的。2、为什么...

2019-04-19 17:08:44 2682 4

原创推荐系统学习笔记之七——大数据量下相似item计算（LSH）

在推荐系统中，我们不可避免的会遇到相似物品推荐的问题，这时候我们首先会想到去计算所有items互相间的相似度。而当我们去一个个计算iem与item之间的相似度（如余弦相似度）时，我们会发现这时一个时间复杂度至少O^(n*n*m)的问题，对于n个item中的每一个item，都要计算它与其他所有item的向量积（向量长度即user个数为m）。这个时间复杂度是绝对无法接受的。于是前辈们实现了...

2019-04-04 23:51:11 1463

xiaoshuo_03_6-6.zip

爬虫框架scrapy实际案例——爬取QQ阅读数据，详情请见：https://blog.csdn.net/qq_35946969/article/details/91446192

2019-06-11

吴恩达深度学习作业-第二课第一周

吴恩达深度学习作业。

2018-10-09

sparkstreaming2.3_kafka0.8_jar包集合

资源不能免费。。。。。。。。。。。。。。。。。。。。。。 sparkstreaming集成kafka总结请看https://blog.csdn.net/qq_35946969/article/details/79995514

2018-04-26

java调用kettle的依赖包

调试代码的过程中一个个找出来的，分享给大家

2017-03-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 深度学习笔记之五——tensorflow的多值离散值特征的embedding

原创 深度学习笔记之四——feature_column

原创 深度学习笔记之三——tensorflow实现wide&deep模型

原创 推荐系统学习笔记之七——大数据量下相似item计算（LSH）