概述and特征提取

向量化:

向量化是可以去将这个图片进行向量化也可以去将这个文章进行一个向量化

我们在考虑事情的进程的时候

变成向量以后,我们是需要去考虑这个这个事情的发展的顺序的

同时存在着歧义的问题

1.太长

2.忽略了顺序

3.存在歧义

无法去量化的事情,就无法去优化

one-hot非常的简单和直接,方便我们人们去操作的方法

处理图像和处理文字

处理文字的难度是远高于处理图像的

百度的对中文的文字的处理是非常的好的

用户画像

第一个区分的方式的时候

我们会去发现这个女性的数值要去比男的大,显然这个是不合理的

所以我们会去使用第二种的方式,这个方式虽然会出现数值上的相关的冗余,但是满足了公平性的这个相关的要求

对于电商上面而言

 对于年龄方面的相关的概念,两者在一般的前提条件之下,相差的所存在的相关的年龄是不是特别明显的

所以我们就把这个年龄分成多个相关的分段

虽然没有那么的细致,但是我们可以在区域内分成了多个有意义的分段

根据这个具体的场景去区分这个空间

对于这个边界值的选择也是十分的重要的

而且我们可以去将这两个的边界进行一定的重叠,这样的话也会保证这有一定的缓冲

在我们的实际的场景中对于不同的特征的相关的存在,我们会去最佳注重的特征的时候,如果这个这个特征之间并没有去存在着相关的特征之间的差异,那么我们最佳要去保证的就是这个特征所设定的值的大小是没有差别的,不然后面的运算出问题,这个数据是要保证的处理是正确的 , 不然之后的算法也会出现着很多的问题

组合特征

当多种的不同的条件叠加起来的话,这个相关的特征的数值也会发生的着不同的改变

不同的时间所产生的相关的条件也会发生改变

可以存在着多种的组合

亿维的特征:就是多种不同的组合之中进行了多种的组合进行组合出来的

每一个的事物都是一个短向量,我们要去把这个事物进行一个组合,这样就可以变成一个长向量了

而且我们还要去注重业务的相关的实现

把场景的知识去变成相应的一个向量

场景,向量,模型

进行模型的相关的构建 

离线和在线的模型

在后面的学习的过程的时候,我们会更加的出注重这个模型

在之后我们会在这个向量的这个模块中之间去开始

不管是这个深度模型还是去传统的模型

这个实现的过程都是一样的

这个深度学习就是对这个场景的要求降低了

深度学习的量两大问题

1.性能问题

2.数据量问题

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值