自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 【Spark+NLP】3、手机短信分类实例详细研究(2)变态详细版

接上篇,本文为主体代码。object SpamMessageClassifier {object:声明一个单例对象 def main(args: Array[String]) {1、这儿,args是一个Array[String]类型的方法参数。也就是说,args是一个String数组。在Scala中,Array是一个具有类型参数指明其元素类型的类(一个真正的类,而不是JAVA中那...

2019-07-26 10:49:35 949

转载 【收集】NLP语料库数据集+持续更新

来源:大数据文摘本文共4270字,建议阅读7分钟。本文为你奉上100多个按字母顺序排列的开源自然语言处理文本数据集列表。奉上100多个按字母顺序排列的开源自然语言处理文本数据集列表(原始未结构化的文本数据),快去按图索骥下载数据自己研究吧!数据集 Apache软件基金会公开邮件档案:截止到2011年7月11日全部公开可用的Apache软件基金会邮件档案。(...

2019-07-22 16:42:29 8358

原创 【Spark+NLP】2、手机短信分类实例详细研究(1)变态详细版

《图解Spark》一书中的一段代码,使用spark+word2vec+前馈神经网络,实现手机短信分类。本人使用这个例子研究此类课题的实现过程,本文为代码的详细注释。(自用,入门,过于详细。)本文仅为头部信息,主体代码见后续(2)(3)等。。import org.apache.log4j.{Level, Logger}1、在应用程序中添加日志记录总的来说基于三个目的:监视代码中...

2019-07-22 14:39:14 1020 3

原创 【Spark+NLP】1、idea安装scala + maven的安装和配置

一、在IDEA中使用scala若首次登录时未安装scala插件,可在此处重新安装:找到文件---设置---plugins,点击即可安装好后重启IDEA即可。二、maven的安装与配置本人因为需要对部分代码进行打包,查资料了解到需要用到maven,故使用。1、打开官网http://maven.apache.org/download.cgi2、下载此项3、...

2019-07-21 00:15:05 350

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除