素质云笔记/Recorder...

Research Area:计算机视觉舆情 + 知识图谱

自定义博客皮肤

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

R︱shiny实现交互式界面布置与搭建(案例讲解+学习笔记)

看了看往期的博客,这个话题竟然是第一次涉及,还真是学无止境啊。 Web Service 这个概念比较成功了, 在SOAP服务之后, Restful服务的普及, 使得数据库的CRUD操作通过网络无限延伸。 普遍的好处是: 1) 你不需要安装任何程序, 携带数据, 只要有网的地方,...

2016-11-30 17:59:04

阅读数 18797

评论数 2

R︱Linux+Rstudio Server尝鲜笔记(打造最佳Rstudio体验+报错的解决方案)

Rstudio Server 是Rstudio开发的基于R语言的网页版(只能在Linux),你在手机上都可以运行R,还是挺方便的。就是配置起来有点麻烦。      官方下载链接:https://www.rstudio.com/products/rstudio/download-server/———...

2016-11-29 12:17:06

阅读数 6010

评论数 0

R︱foreach+doParallel并行+联用迭代器优化内存+并行机器学习算法

接着之前写的并行算法parallel包,parallel相比foreach来说,相当于是foreach的进阶版,好多东西封装了。而foreach包更为基础,而且可自定义的内容很多,而且实用性比较强,可以简单的用,也可以用得很复杂。笔者将自己的学习笔记记录一下。R︱并行计算以及提高运算效率的方式(p...

2016-11-26 15:11:08

阅读数 4737

评论数 0

R语言︱贝叶斯网络语言实现及与朴素贝叶斯区别(笔记)

  每每以为攀得众山小,可、每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ ———————————————————————————       一、贝叶斯网络与朴素贝叶斯的区别         朴素贝叶斯的假设前提有两个第一个为:各特征彼此独立;第二个...

2016-11-26 00:04:06

阅读数 14028

评论数 14

重磅︱文本挖掘深度学习之word2vec的R语言实现

笔者寄语:2013年末,Google发布的 word2vec工具引起了一帮人的热捧,大家几乎都认为它是深度学习在自然语言领域的一项了不起的应用,各种欢呼“深度学习在自然语言领域开始发力 了”。 基于word2vec现在还出现了doc2vec,word2vec相比传统,考虑单词上下文的语义;但是do...

2016-11-25 23:33:11

阅读数 18698

评论数 1

R语言·文本挖掘︱Rwordseg/rJava两包的安装(安到吐血)

  每每以为攀得众山小,可、每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ ———————————————————————————   R语言·文本挖掘︱Rwordseg/rJava两包的安装     笔者:文本挖掘中这两个包可谓是“老顽固”,做文本挖掘必...

2016-11-25 23:24:56

阅读数 30993

评论数 9

R语言︱噪声数据处理、数据分组——分箱法(离散化、等级化)

分箱法在实际案例操作过程中较为常见,能够将一些数据离散化,等级化,比如年龄段,我们并不想知道确切的几岁,于是乎可以将其分组、分段。 基础函数中cut能够进行简单分组,并且可以用于等宽分箱法。 cut函数:cut(x, n):将连续型变量x分割为有着n个水平的因子 [plain] vie...

2016-11-25 17:06:55

阅读数 27999

评论数 0

NLP+词法系列(一)︱中文分词技术小结、几大分词引擎的介绍与比较

笔者想说:觉得英文与中文分词有很大的区别,毕竟中文的表达方式跟英语有很大区别,而且语言组合形式丰富,如果把国外的内容强行搬过来用,不一样是最好的。所以这边看到有几家大牛都在中文分词以及NLP上越走越远。哈工大以及北大的张华平教授(NLPIR)的研究成果非常棒! 但是商业应用的过程中存在的以下的问题...

2016-11-25 14:02:06

阅读数 36424

评论数 1

R+NLP︱text2vec包——四类文本挖掘相似性指标 RWMD、cosine、Jaccard 、Euclidean (三,相似距离)

在之前的开篇提到了text2vec,笔者将其定义为R语言文本分析"No.1",她是一个文本分析的生态系统。笔者在学习之后发现开发者简直牛!基于分享精神,将自学笔记记录出来。开篇内容参考:重磅︱R+NLP:text2vec包——New 文本分析生态系统 No.1(一,简介)R+N...

2016-11-22 15:35:45

阅读数 10873

评论数 0

R+NLP︱text2vec包——BOW词袋模型做监督式情感标注案例(二,情感标注)

在之前的开篇提到了text2vec,笔者将其定义为R语言文本分析"No.1",她是一个文本分析的生态系统。笔者在学习之后发现开发者简直牛!基于分享精神,将自学笔记记录出来。开篇内容参考:重磅︱R+NLP:text2vec包——New 文本分析生态系统 No.1(一,简介)   ...

2016-11-21 18:36:23

阅读数 8895

评论数 4

win10系统搭建虚拟机:VMware Workstation Player 12环境+Ubuntu Kylin 16.04 LTS系统

笔者小白一枚,其实连虚拟机是个啥都不知道...实属惭愧,介于此所以今天倒腾了一下花了一上午就已经搭建好一个VMware Workstation Player 12免费版的,很哈皮,于是赶紧分享一下。问题1:win10自带的虚拟机去哪儿了?      笔者自用win10系统,就在苦恼win10好像听...

2016-11-19 15:52:20

阅读数 5237

评论数 0

重磅︱R+NLP:text2vec包——New 文本分析生态系统 No.1(一,简介)

词向量的表示主流的有两种方式,一种当然是耳熟能详的google的word2vec,还有一类就是GloVe。那么前面一类有三个开源的包,后面这一类我倒是看到得不多,恰好是在我关注了许久的一个包里面有,它就是text2vec啦。该包提供了一个强大API接口,能够很好地处理文本信息。       本包是...

2016-11-14 18:35:50

阅读数 7449

评论数 0

R︱Rstudio 1.0版本尝鲜(R notebook、下载链接、sparkR、代码时间测试profile)

2016年11月1日,RStudio 1.0版本正式发布!这是自2011年2月RStudio发布以来的第10个主要版本,也是更新最大的一次。主要亮点如下:1.R Notebooks 的辅助工具2.对sparklyr包的集成支持(R与Spark连接)3.profvis包进行性能分析4.基于readr...

2016-11-02 15:43:17

阅读数 4583

评论数 0

提示
确定要删除当前文章?
取消 删除