自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

素质云笔记

营销数据科学:因果推断,CDP,用户画像,短视频挖掘等

  • 博客(13)
  • 资源 (5)
  • 收藏
  • 关注

原创 R︱shiny实现交互式界面布置与搭建(案例讲解+学习笔记)

看了看往期的博客,这个话题竟然是第一次涉及,还真是学无止境啊。 Web Service 这个概念比较成功了, 在SOAP服务之后, Restful服务的普及, 使得数据库的CRUD操作通过网络无限延伸。 普遍的好处是: 1) 你不需要安装任何程序, 携带数据, 只要有网的地方, 你就能演示。(远程) 2) 只要安装一次, 可以多人使用, 可以让别人试用。(多用户)

2016-11-30 17:59:04 42556 2

原创 R︱Linux+Rstudio Server尝鲜笔记(打造最佳Rstudio体验+报错的解决方案)

Rstudio Server 是Rstudio开发的基于R语言的网页版(只能在Linux),你在手机上都可以运行R,还是挺方便的。就是配置起来有点麻烦。      官方下载链接:https://www.rstudio.com/products/rstudio/download-server/————————————————————————————————1、为啥笔者觉得Rstudio Server

2016-11-29 12:17:06 11529

原创 R︱foreach+doParallel并行+联用迭代器优化内存+并行机器学习算法

接着之前写的并行算法parallel包,parallel相比foreach来说,相当于是foreach的进阶版,好多东西封装了。而foreach包更为基础,而且可自定义的内容很多,而且实用性比较强,可以简单的用,也可以用得很复杂。笔者将自己的学习笔记记录一下。R︱并行计算以及提高运算效率的方式(parallel包、clusterExport函数、SupR包简介)——————————————————

2016-11-26 15:11:08 12492 1

原创 R语言︱贝叶斯网络语言实现及与朴素贝叶斯区别(笔记)

 每每以为攀得众山小,可、每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~———————————————————————————   一、贝叶斯网络与朴素贝叶斯的区别      朴素贝叶斯的假设前提有两个第一个为:各特征彼此独立;第二个为且对被解释变量的影响一致,不能进行变量筛选。但是很多情况这一假设是无法做到的,比如解决文本分类时,相...

2016-11-26 00:04:06 24943 15

原创 重磅︱文本挖掘深度学习之word2vec的R语言实现

笔者寄语:2013年末,Google发布的 word2vec工具引起了一帮人的热捧,大家几乎都认为它是深度学习在自然语言领域的一项了不起的应用,各种欢呼“深度学习在自然语言领域开始发力 了”。基于word2vec现在还出现了doc2vec,word2vec相比传统,考虑单词上下文的语义;但是doc2vec不仅考虑了单词上下文的语义,还考虑了单词在段落中的顺序。———————————

2016-11-25 23:33:11 26628 2

原创 R语言·文本挖掘︱Rwordseg/rJava两包的安装(安到吐血)

 每每以为攀得众山小,可、每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~——————————————————————————— R语言·文本挖掘︱Rwordseg/rJava两包的安装  笔者:文本挖掘中这两个包可谓是“老顽固”,做文本挖掘必须要过的关卡,今天倒腾了一天,桌面下了一堆东西,终于弄出来了。故此,赶紧记录下来,以后可用:关于这...

2016-11-25 23:24:56 40433 9

原创 R语言︱噪声数据处理、数据分组——分箱法(离散化、等级化)

分箱法在实际案例操作过程中较为常见,能够将一些数据离散化,等级化,比如年龄段,我们并不想知道确切的几岁,于是乎可以将其分组、分段。基础函数中cut能够进行简单分组,并且可以用于等宽分箱法。cut函数:cut(x, n):将连续型变量x分割为有着n个水平的因子[plain] view plain copy print?cut(x,

2016-11-25 17:06:55 41706

原创 NLP+词法系列(一)︱中文分词技术小结、几大分词引擎的介绍与比较

笔者想说:觉得英文与中文分词有很大的区别,毕竟中文的表达方式跟英语有很大区别,而且语言组合形式丰富,如果把国外的内容强行搬过来用,不一样是最好的。所以这边看到有几家大牛都在中文分词以及NLP上越走越远。哈工大以及北大的张华平教授(NLPIR)的研究成果非常棒!但是商业应用的过程中存在的以下的问题:1、是否先利用开源的分词平台进行分词后,再自己写一些算法进行未登录词、歧义词的识别?2、或

2016-11-25 14:02:06 48388 2

原创 R+NLP︱text2vec包——四类文本挖掘相似性指标 RWMD、cosine、Jaccard 、Euclidean (三,相似距离)

在之前的开篇提到了text2vec,笔者将其定义为R语言文本分析"No.1",她是一个文本分析的生态系统。笔者在学习之后发现开发者简直牛!基于分享精神,将自学笔记记录出来。开篇内容参考:重磅︱R+NLP:text2vec包——New 文本分析生态系统 No.1(一,简介)R+NLP︱text2vec包——BOW词袋模型做监督式情感标注案例(二,情感标注)text2vec中包括了四大类距离:Cosi

2016-11-22 15:35:45 16440 1

原创 R+NLP︱text2vec包——BOW词袋模型做监督式情感标注案例(二,情感标注)

在之前的开篇提到了text2vec,笔者将其定义为R语言文本分析"No.1",她是一个文本分析的生态系统。笔者在学习之后发现开发者简直牛!基于分享精神,将自学笔记记录出来。开篇内容参考:重磅︱R+NLP:text2vec包——New 文本分析生态系统 No.1(一,简介)      文档可以以多种方式表达,单独词组、n-grams、特征hashing化的方法等。      一般来说文本分析的步骤有

2016-11-21 18:36:23 13282 5

原创 win10系统搭建虚拟机:VMware Workstation Player 12环境+Ubuntu Kylin 16.04 LTS系统

笔者小白一枚,其实连虚拟机是个啥都不知道...实属惭愧,介于此所以今天倒腾了一下花了一上午就已经搭建好一个VMware Workstation Player 12免费版的,很哈皮,于是赶紧分享一下。问题1:win10自带的虚拟机去哪儿了?      笔者自用win10系统,就在苦恼win10好像听说过有自带的虚拟机hyper-v,我的笔记本里面怎么没有呢?那么win10系统的虚拟机跑哪儿了呢?

2016-11-19 15:52:20 10709

原创 重磅︱R+NLP:text2vec包——New 文本分析生态系统 No.1(一,简介)

词向量的表示主流的有两种方式,一种当然是耳熟能详的google的word2vec,还有一类就是GloVe。那么前面一类有三个开源的包,后面这一类我倒是看到得不多,恰好是在我关注了许久的一个包里面有,它就是text2vec啦。该包提供了一个强大API接口,能够很好地处理文本信息。       本包是由C++写的,流处理器可以让内存得到更好的利用,一些地方是用RcppParallel包进行并行化加乘,

2016-11-14 18:35:50 11576 2

原创 R︱Rstudio 1.0版本尝鲜(R notebook、下载链接、sparkR、代码时间测试profile)

2016年11月1日,RStudio 1.0版本正式发布!这是自2011年2月RStudio发布以来的第10个主要版本,也是更新最大的一次。主要亮点如下:1.R Notebooks 的辅助工具2.对sparklyr包的集成支持(R与Spark连接)3.profvis包进行性能分析4.基于readr/readxl/haven,优化数据读取5.R Markdown的辅助工具(websites和book

2016-11-02 15:43:17 6330

Rstudio Server + Docker + tensorflowR的dockerfile文件

Rstudio Server + Docker + tensorflowR - 云端使用R语言与GPU深度学习

2018-09-28

数美科技李田:机器学习与在数美业务上的落地

数美科技李田:机器学习与在数美业务上的落地

2018-09-11

Prophet的案例数据

R的Prophet包的数据集

2017-02-26

VMware-player-12.0.0-part1

VMware-player-12.0.0-part1,一共两个部分。

2016-11-19

word2vec自编译函数(By Jian Li,2014-09-21)

R语言实现深度学习word2vec,word2vec包含两个模型CBOW以及Skp-gram模型,R语言实现的过程中需要配置一些内容,详情见包中附件readme。

2016-05-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除