大数据标签体系建立

我们要为大数据平台建立一套标签体系,首先要明确我们要建立什么,在我看来我们需要建立独立的三样东西:类目标签体系、用户画像和应用场景。


类目标签体系是以业务核心为中心建立的,业务核心就是你要做的这个大数据平台里面最重要的那个点。举点例子,电商平台的业务核心就是商品,教育平台的核心业务就是教育。电商平台下的类目标签就以商品的分类为基础构建类目树,树的根节点就是商品,往下分可能包括女装/内衣、男装/运动户外、女鞋/男鞋/箱包等子类,等到分到了叶子节点(注意不是越细越好,再往下分对于业务毫无助益了就可以不分了),就可以分析叶子节点的自有属性并且添加到类目树上面去,那么这时一棵类目树就构建好了。怎么确定一个大数据平台的业务核心是什么,这里我提供一种方法:利用头脑风暴把有关涉及该平台的所有事物罗列出来,然后根据物品与平台的关联性大小为基准,将关联性较小的物品一一删除,最后留下来的那个物品就是该平台的业务核心。

但是一直到这里我们建立的并不是类目标签体系,只能称之为类目属性体系。如何从类目标签体系进化到类目属性体系呢?这个时候我们就需要对标签有更加深入的了解了。如果说标签就是一些描述性的词语或者短语的话,那么这些标签从何而来?我们可以从原始的数据源中获取到标签,通过纯粹的语义分析对自然语言处理来获取,这里我们获取到的是原始数据标签。对原始数据进行一定的统计学分析之后我们也可以获取到一部分标签,这里的标签我们称之为统计数据标签。或者我们也可以对原始数据经过算法模型计算后获取一些高级标签,这里的标签我们称之为算法数据标签。总结来说,标签分为三类:原始数据标签、统计数据标签、算法数据标签。类目属性体系中只包括原始数据标签,而我们需要的类目标签体系中需要囊括这三种类型的标签。

至于用户画像,我们

  • 6
    点赞
  • 50
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值