![](https://img-blog.csdnimg.cn/20190927151124774.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
机器学习-大赛案例
文章平均质量分 82
介绍项目流程及代码展示
why do not
这个作者很懒,什么都没留下…
展开
-
【天池学习赛】零基础入门NLP - 新闻文本分类
一、赛题描述赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐的文本数据。赛题任务:赛题以自然语言处理为背景,要求选手对新闻文本进行分类,这是一个典型的字符识别问题赛题数据由以下几个部分构成:训练集20w条样本,测试集A包括5w条样本,测试集B包括5w条样本。为了预防选手人工标注测试集的情况,我们将比赛数据的文本按照字符级别进行了匿名处理。处理后的赛题训练数据如下:label原创 2021-08-31 11:03:49 · 2278 阅读 · 0 评论 -
【天池学习赛】数据分析达人赛3:汽车产品聚类分析
赛题背景赛题以竞品分析为背景,通过数据的聚类,为汽车提供聚类分类。对于指定的车型,可以通过聚类分析找到其竞品车型。通过这道赛题,鼓励学习者利用车型数据,进行车型画像的分析,为产品的定位,竞品分析提供数据决策。赛题数据数据源:car_price.csv,数据包括了205款车的26个字段1 Car_ID Unique id of each observation (Interger) 2 Symboling Its assigned insurance risk ra原创 2021-08-25 15:52:24 · 3227 阅读 · 9 评论 -
【天池学习赛】数据分析达人赛2-产品关联分析
赛题背景赛题以购物篮分析为背景,要求选手对品牌的历史订单数据,挖掘频繁项集与关联规则。通过这道赛题,鼓励学习者利用订单数据,为企业提供销售策略,产品关联组合,为企业提升销量的同时,也为消费者提供更适合的商品推荐。赛题数据数据源:order.csv,product.csv,customer.csv,date.csv ,分别为订单表,产品表,客户表,日期表订单表订单日期 年份 订单数量 产品ID 客户ID 交易类型 销售区域ID 销售大区 国家原创 2021-08-20 16:48:03 · 2038 阅读 · 1 评论 -
【天池学习赛】数据分析达人赛1:用户情感可视化分析
赛题简介赛题以网络舆情分析为背景,要求选手根据用户的评论来对品牌的议题进行数据分析与可视化。通过这道赛题来引导常用的数据可视化图表,以及数据分析方法,对感兴趣的内容进行探索性数据分析。赛题数据数据源: earphone_sentiment.csv,为10000+条行业用户关于耳机的评论使用天池实验室打比赛即可直接在notebook中挂载数据源字段名称类型描述说明content_idInt数据ID/contentString文本内容/subjectS原创 2021-08-13 17:25:21 · 2629 阅读 · 1 评论