大数据下服装品牌知识挖掘浅析

大数据时代产生了海量的数据,但是数据类型多元异构、网页发布不规范等因素导致数据价值密度低,信息造价昂贵。大数据分析和数据挖掘是基于统计分析学的从数据中获取知识的一种研究方法,在互联网、金融、医疗等多个行业都有很好的发展与应用。语料库分析法在国外已有三十年以上的研究历史,目前服装领域内多使用学术文献作为研究语料库进行行业信息发现和预测,缺乏对其他行业数据的探索与使用;为了提高服装行业对开源数据的利用率,构建行业语料库、通过合理的数据分析工具对行业数据进行知识挖掘,对行业知识工程的建设具有重要的实践意义。

 

1服装品牌研究语料库构建

1.1数据渠道选择

为保证语料库中服装品牌数据的多样性和全面性需对采集渠道进行评估筛选,最终确定的数据源类型如下:(1)服装专业平台和品牌网站:如WGSN、POP流行趋势平台,中国时尚网、中国报告大厅等网站。(2)学术资源平台:CNKI数据库。(3)通用知识网站:如百度百科知识库。

1.2研究样本选择

进行品牌调研,围绕“服装品牌排行”检索知名度较高、数据信息分布较多的服装品牌。共选择了60个服装品牌,主要可分为以下几种类型。(1)国际奢侈品牌。如阿玛尼、巴宝莉等共32个。(2)国内具有一定创建历史与知名度的服装

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值