数据特征的选取

图像特征的提取和选择是图像处理过程中很重要的环节,对后续图像分类有着重要的影响,并且对于图像数据具有样本少,维数高的特点,要从图像中提取有用的信息,必须对图像特征进行降维处理,特征提取与特征选择就是最有效的降维方法,其目的是得到一个反映数据本质结构、识别率更高的特征子空间 。 一.原始特征提...

2017-09-14 14:50:36

阅读数 10226

评论数 0

如何通过数据驱动业务发展

如何通过数据驱动业务发展 人人都是产品经理 百家号 09-07 13:33 本文根据刘立明在起点学院线下沙龙分享的课程整理而成,加入起点学院在线社员(或复制报名链接:http://t.cn/R53OsvD到浏览器中详细了解),即可观看本课程视频回放及尊...

2017-09-07 14:52:21

阅读数 1366

评论数 0

以客户为中心进行数据挖掘

http://www.mahaixiang.cn/sjfx/997.html

2017-09-07 14:49:47

阅读数 287

评论数 0

特征工程-特征离散化

连续特征的离散化:在什么情况下将连续的特征离散化之后可以获得更好的效果? Q:CTR预估,发现CTR预估一般都是用LR,而且特征都是离散的。为什么一定要用离散特征呢?这样做的好处在哪里? A: 在工业界,很少直接将连续值作为逻辑回归模型的特征输入,而是将连续特征离散化为一系列0、...

2017-09-07 14:40:19

阅读数 234

评论数 0

机器学习 必读的课程内容

https://www.leiphone.com/news/201610/Oqndr7PXFB9BRI9p.html

2017-09-07 14:35:37

阅读数 172

评论数 0

机器学习-特征提取

第4步:特征工程 或许比选择算法更重要的是正确选择表示数据的特征。从上面的列表中选择合适的算法是相对简单直接的,然而特征工程却更像是一门艺术。 主要问题在于我们试图分类的数据在特征空间的描述极少。利如,用像素的灰度值来预测图片通常是不佳的选择;相反,我们需要找到能提高信噪比的数据变换。...

2017-09-07 14:28:55

阅读数 886

评论数 0

机器学习-文本特征选择

一、课题背景概述 文本挖掘是一门交叉性学科,涉及数据挖掘、机器学习、模式识别、人工智能、统计学、计算机语言学、计算机网络技术、信息学等多个领域。文本挖掘就是从大量的文档中发现隐含知识和模式的一种方法和工具,它从数据挖掘发展而来,但与传统的数据挖掘又有许多不同。文本挖掘的对象是海量、异构、分布...

2017-09-07 14:26:41

阅读数 660

评论数 0

机器学习-特征选择

文章来自我的微信公众号CodingRush,欢迎扫码关注。 很多时候我们需要做特征选择,一方面是因为我们希望模型能够使用好的特征拟合数据,另一方面多余的特征会导致模型复杂度高,降低模型的泛化能力。最常见的例子就是,文本分类,我们不可能把所有的词都作为特征,而是希望选一些“好的”词...

2017-09-07 14:25:45

阅读数 129

评论数 0

特征选择的一些方法

https://wenku.baidu.com/view/12929b5b8762caaedd33d4f2.html

2017-09-07 14:17:16

阅读数 150

评论数 0

数据分析中的辛普森悖论

在某公司工作时,曾发现过一个诡异的事情。  当时正在做公司整体的战略规划,发现公司客户各年龄段的客单价都是呈上升趋势,可是整体客单价却出现下滑。  今天听了公司内部的一个分享课才知道, 原来这个就是 辛普森悖论。  人懒,懒得自己整理数据和文字,就直接转载网上搜索来的博客     ...

2017-09-04 11:14:27

阅读数 442

评论数 0

数据仓库建模参考

https://wenku.baidu.com/view/b6bd5ccb4028915f804dc294.html 宽表的思考 一 宽表的优点 1.      宽表浅意上的好处 在当前这个项目中,大量使用了宽表,字段超过一百五十个字段的宽表有五张,分别是客户机构级信息表、客户客户经...

2017-09-04 10:04:36

阅读数 1327

评论数 0

数据仓库的架构-参考

数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。其实数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。因此数据仓库的基本架构主要包含的是数据流...

2017-09-01 14:50:11

阅读数 271

评论数 0

用户画像—设计参考

https://wenku.baidu.com/view/9aaa543a6294dd88d1d26b4e.html http://www.infoq.com/cn/articles/4-billion-mobile-device-user-portrait-and-tag-architec...

2017-09-01 10:57:43

阅读数 1194

评论数 0

用户画像-方法

为了让团队成员在研发过程中能够抛开个人喜好,将焦点关注在目标用户的动机和行为上,Alan Cooper提出了Persona这一概念。“赢在用户”这本书将其翻译为“人物角色”,在腾讯我们习惯了使用“用户画像”这个术语。表达的意思一样,是真实用户的虚拟代表,是在深刻理解真实数据的基础上得出的一个的虚拟...

2017-09-01 10:17:37

阅读数 643

评论数 0

用户画像-构建步骤

有一句话是,千万人撩你,不如一人懂你,这句话在互联网圈可以说成是,真正的了解用户,才能得到用户,所以,用户画像的重要性不言而喻。 什么是用户画像? 用户画像可以简单理解成是海量数据的标签,根据用户的目标、行为和观点的差异,将他们区分为不同的类型,然后每种类型中抽取出典型特征,赋予名字、...

2017-09-01 10:11:30

阅读数 1762

评论数 0

用户画像-如何设计

推荐星级:★★★★★   ▌阅读时间:12min   ▌推荐理由:用户画像分析是PM的基本能力,也是优秀运营人的必会技能。你还不会?进来学啊!   本期干货铺内容大纲:   Step 1、理论科普篇——快速了解用户画像   什么是用户画像?【干货x2】   ...

2017-09-01 10:03:49

阅读数 4441

评论数 0

数据仓库-架构参考

数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。其实数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。因此数据仓库的基本架构主要包含的是数据流...

2017-09-01 09:51:06

阅读数 389

评论数 0

解耦-大宽表

数据仓库应用中,宽表模型以结构简单,模型容易理解,数据访问效率等优势,被业界广泛采用。所谓宽表就是,基于某个实体分析对象而建立的一个逻辑数据体系,由实体的维度、描述信息、以及基于这个实体一系列度量组成。它是一个逻辑的概念,在物理实现中不可能就针对一个实体对象建立一个大宽表。因为这样,对于,刷新效率...

2017-08-31 19:42:12

阅读数 985

评论数 0

数据仓库-模型

Technorati 标签: 数据仓库,模型设计 数据仓库的模型设计 A. 数据建模方法论 数据仓库模型设计遵循“自顶向下、逐步求精”的设计原则。 模型设计分为三个阶段: 1,概念模型 对业务的范围和使用,从高度上进行抽象概括,也就是划分主题域。 一般划分为8个主...

2017-08-31 19:38:52

阅读数 1152

评论数 0

阿里的数仓

干货:解码OneData,阿里的数仓之路 标签: 数据仓库架构 2017-04-26 10:53 249人阅读 评论(0) 收藏 举报  分类: 工作(47)  目录(?)[+] 摘要: 据IDC报告,预计到2020年全球数据总量...

2017-08-31 19:26:45

阅读数 2195

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭