自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

WhyNot

喜欢机器学习,数据挖掘,自然语言处理的可以一起交流。

  • 博客(2)
  • 收藏
  • 关注

原创 连续特征离散化方法介绍

1. 离散化技术分类连续属性的离散化方法也可以被称为分箱法,即将一组连续的值根据一定的规则分别放到其术语的集合中。 离散化技术可以根据如何对数据进行离散化加以分类,可以根据是否使用类信息或根据进行方向(即自顶向下或自底向上)分类。 如果离散化过程使用类信息,则称它为监督离散化(superviseddiscretization);否则是非监督的(unsupervised)。 如果

2018-01-30 10:48:40 10721 1

转载 数据标注问题

文章商品分类之数据标注前言之前有些过一篇文本分类的文章,从技术层面来描述了包括传统NLP技术、深度学习相关的文本分类技术,很有幸做了一个关于文本分类的项目,对这块有进一步的认识。 项目的基本需求是对资讯文章按照语义进行分类。例如http://www.ifanr.com/906951中描述的描述的小米手机相关的新闻,需要将文章分类为手机-手机通讯,然后结合文章相关tag词

2018-01-25 17:56:05 14776 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除