自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (4)
  • 收藏
  • 关注

原创 深度学习笔记之五——tensorflow的多值离散值特征的embedding

Embedding embedding是取代onehot的比较好的一种方式,与NLP中的word embedding有所区别,我们这里的embedding,仅仅是因为该特征unique值过多,onehot产生的矩阵过宽,所以取而代之使用embedding来减少维度。单值 回到题目,对于一般情形下的离散特征,我称之为单值离散值特征,如下: ...

2019-04-24 17:05:53 4714 1

原创 深度学习笔记之四——feature_column

1、numeric_column —— 代表连续数值类型的特征列。2、bucketized_column——将连续数值分箱,如:输入(1,2,3,4,5)按照(0,34,5)两个区间分箱,分箱成为(0,0,0,1,1)的onehot形式,即最终结果为:),( [1,0] #1 [1,0] #2 [1,0] #3 [0,1] #4 [0,1] #53、categor...

2019-04-22 08:51:06 1511

原创 深度学习笔记之三——tensorflow实现wide&deep模型

wide&deep模型原理十分简单,说白了就是wide类模型与deep类模型的组合(借鉴google paper,但是选用模型不同)。提出两个问题:1、什么是wide类、deep类?wide类模型一般指的是复杂度不高的线性模型,以LR最为常见。deep类模型一般指的是复杂度比较高、拟合数据能力强的神经网络,boosting、bagging类模型应该也是可以的。2、为什么...

2019-04-19 17:08:44 2682 4

原创 推荐系统学习笔记之七——大数据量下相似item计算(LSH)

在推荐系统中,我们不可避免的会遇到相似物品推荐的问题,这时候我们首先会想到去计算所有items互相间的相似度。而当我们去一个个计算iem与item之间的相似度(如余弦相似度)时,我们会发现这时一个时间复杂度至少O^(n*n*m)的问题,对于n个item中的每一个item,都要计算它与其他所有item的向量积(向量长度即user个数为m)。 这个时间复杂度是绝对无法接受的。于是前辈们实现了...

2019-04-04 23:51:11 1463

xiaoshuo_03_6-6.zip

爬虫框架scrapy实际案例——爬取QQ阅读数据,详情请见:https://blog.csdn.net/qq_35946969/article/details/91446192

2019-06-11

吴恩达深度学习作业-第二课第一周

吴恩达深度学习作业。

2018-10-09

sparkstreaming2.3_kafka0.8_jar包集合

资源不能免费。。。。。。。。。。。。。。。。。。。。。。 sparkstreaming集成kafka总结请看https://blog.csdn.net/qq_35946969/article/details/79995514

2018-04-26

java调用kettle的依赖包

调试代码的过程中一个个找出来的,分享给大家

2017-03-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除