- 博客(2)
- 收藏
- 关注
原创 连续特征离散化方法介绍
1. 离散化技术分类连续属性的离散化方法也可以被称为分箱法,即将一组连续的值根据一定的规则分别放到其术语的集合中。 离散化技术可以根据如何对数据进行离散化加以分类,可以根据是否使用类信息或根据进行方向(即自顶向下或自底向上)分类。 如果离散化过程使用类信息,则称它为监督离散化(superviseddiscretization);否则是非监督的(unsupervised)。 如果
2018-01-30 10:48:40 10721 1
转载 数据标注问题
文章商品分类之数据标注前言之前有些过一篇文本分类的文章,从技术层面来描述了包括传统NLP技术、深度学习相关的文本分类技术,很有幸做了一个关于文本分类的项目,对这块有进一步的认识。 项目的基本需求是对资讯文章按照语义进行分类。例如http://www.ifanr.com/906951中描述的描述的小米手机相关的新闻,需要将文章分类为手机-手机通讯,然后结合文章相关tag词
2018-01-25 17:56:05 14776 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人