- 博客(20)
- 资源 (22)
- 收藏
- 关注
转载 文本挖掘深度学习之word2vec的R语言实现
笔者寄语:2013年末,Google发布的 word2vec工具引起了一帮人的热捧,大家几乎都认为它是深度学习在自然语言领域的一项了不起的应用,各种欢呼“深度学习在自然语言领域开始发力 了”。基于word2vec现在还出现了doc2vec,word2vec相比传统,考虑单词上下文的语义;但是doc2vec不仅考虑了单词上下文的语义,还考虑了单词在段落中的顺序。如果想要了解word2vec的
2017-04-23 13:46:47 4264
转载 R语言-文本挖掘 主题模型 文本分类
####需要先安装几个R包,如果有这些包,可省略安装包的步骤。#install.packages("Rwordseg")#install.packages("tm");#install.packages("wordcloud");#install.packages("topicmodels")例子中所用数据数据来源于sougou实验室数据。数据网址:http:/
2017-04-23 13:41:07 2903 1
转载 R语言进行中文分词和聚类
原文来自:http://www.csdn123.com/html/itweb/20130911/113549_113527_113553.htm目标:对大约6w条微博进行分类环境:R语言 由于时间较紧,且人手不够,不能采用分类方法,主要是没有时间人工分类一部分生成训练集……所以只能用聚类方法,聚类最简单的方法无外乎:K-means与层次聚类。尝试过使用K-means方法,但结果
2017-04-23 13:35:36 2332
转载 R语言做文本挖掘 Part5情感分析
Part5情感分析 【发现有人转载,决定把格式什么重新整理一遍,有时间做个进阶版文本挖掘,恩!原文地址:CSDN-R语言做文本挖掘 Part5情感分析】这是这个系列里面最后一篇文章了,其实这里文本挖掘每一个部分单拎出来都是值得深究和仔细研究的,我还处于初级研究阶段,用R里面现成的算法,来实现自己的需求,当然还参考了众多网友的智慧结晶,所以也想把我的收获总结出来分享给大家,希望也能像我一样在
2017-04-23 13:34:25 1355
转载 R语言做文本挖掘 Part4文本分类
Part3文本聚类里讲到过,分类跟聚类的简单差异。所以要做分类我们需要先整理出一个训练集,也就是已经有明确分类的文本;测试集,可以就用训练集来替代;预测集,就是未分类的文本,是分类方法最后的应用实现。1. 数据准备训练集准备是一个很繁琐的功能,暂时没发现什么省力的办法,根据文本内容去手动整理。这里还是使用的某品牌的官微数据,根据微博内容,我将它微博的主要内容分为了:促销资讯(p
2017-04-23 13:33:52 1368 2
转载 利用R语言的tm包进行文本挖掘
摘要: tm包是R语言中为文本挖掘提供综合性处理的package,进行操作前载入tm包,vignette命令可以让你得到相关的文档说明library(tm)vignette("tm")首先要读取文本,本次操作所用的文本是tm包自带的20个XML格式文本,存 ...tmR语言文本挖掘tm包是R语言中为文本挖掘提供综合性处理的package,进行操作前载入tm包,vignett
2017-04-23 13:32:54 4818
转载 R语言做文本挖掘 Part3文本聚类
Part3文本聚类【发现有人转载,决定把格式什么重新整理一遍,有时间做个进阶版文本挖掘,恩!原文地址:CSDN-R语言做文本挖掘 Part3文本聚类】分类和聚类算法,都是数据挖掘中最常接触到的算法,分类聚类算法分别有很多种。可以看下下面两篇文章对常见的分类聚类算法的简介:分类算法:http://blog.csdn.net/chl033/article/details/5204220
2017-04-23 13:31:36 1177
转载 R语言做文本挖掘 Part2分词处理
Part2分词处理【发现有人转载,决定把格式什么重新整理一遍,有时间做个进阶版文本挖掘,恩!原文地址:CSDN-R语言做文本挖掘 Part2分词处理】在RStudio中安装完相关软件包之后,才能做相关分词处理,请参照Part1部分安装需要软件包。参考文档:玩玩文本挖掘,这篇文章讲用R做文本挖掘很详尽,并且有一些相关资料的下载,值得看看!1. RWordseg功能说明
2017-04-23 13:22:59 542
转载 R语言做文本挖掘 Part1安装依赖包
http://blog.csdn.net/cl1143015961/article/details/44082731Part1 安装依赖包【发现有人转载,决定把格式什么重新整理一遍,有时间做个进阶版文本挖掘,恩!原文地址:CSDN-R语言做文本挖掘 Part1安装依赖包】R语言中中文分析的软件包是Rwordseg,Rwordseg软件包依赖rJava包,rJava需要本机中有安装J
2017-04-23 12:09:33 753
转载 时间序列简单介绍
今年在某服装企业蹲点了4个多月,之间很长一段时间在探索其现货和期货预测,时间序列也是做销售预测的首选,今天和小伙伴分享下时间序列的基本性质和如何用R来挖据时间序列的相关属性。首先读入一个时间序列:从1946年1月到1959年12月的纽约每月出生人口数量(由牛顿最初收集)数据集可以从此链接下载(http://robjhyndman.com/tsdldata/data/nybirths.dat)。
2017-04-22 15:28:30 1143
原创 R语言学习博客
R做数据挖掘http://blog.csdn.net/jiabiao1602/article/details/43153139http://blog.csdn.net/cl1143015961/article/details/42238029
2017-04-22 14:29:26 685
转载 图解Tomcat类加载机制
说到本篇的tomcat类加载机制,不得不说翻译学习tomcat的初衷。 之前实习的时候学习javaMelody的源码,但是它是一个Maven的项目,与我们自己的web项目整合后无法直接断点调试。后来同事指导,说是直接把java类复制到src下就可以了。很纳闷....为什么会优先加载src下的java文件(编译出的class),而不是jar包中的class呢? 现在了解tomcat的类加
2017-04-06 16:12:29 284
转载 ServletContext详解
2.1. //获取servletcontext,ServletContext servletcontext=this.getServletContext();//设置属性servletcontext.setAttribute("name", "ru");out.println("传递参数‘南成如’到name属性中");2.//获取servletcontext
2017-04-06 15:50:28 629
转载 Java利用PropertyDescriptor获取属性的 getter/setter 方法
PropertyDescriptor类:PropertyDescriptor类表示JavaBean类通过存储器导出一个属性。主要方法: 1. getReadMethod(),获得用于读取属性值的方法 2. getWriteMethod(),获得用于写入属性值的方法注:避免使用拼装方法名,反射获取Method对象。如tId,方法名格式与其他不统一,拼装方法名会错
2017-04-05 17:40:08 1213
转载 Java操作PDF之iText详细入门
iText是著名的开放项目,是用于生成PDF文档的一个java类库。通过iText不仅可以生成PDF或rtf的文档,而且可以将XML、Html文件转化为PDF文件。 http://itextpdf.com/ 版本:itextpdf-5.2.1.jar 1、生成一个PDF Java代码 //Step 1—Create a Document.
2017-04-05 12:34:33 429
原创 如何使用java的正则表达式
package com.lh.common.util;import java.util.ArrayList;import java.util.List;import java.util.regex.Matcher;import java.util.regex.Pattern;/** * 正则表达式工具 主要对于字符串的一些操作 * @author yy *
2017-04-05 11:30:52 367
转载 Spring MVC实现文件的上传和下载的功能
xml version="1.0" encoding="UTF-8"?> 2 到入xml文件的约束 --> 3 4 beans xmlns="http://www.springframework.org/schema/beans" 5 xmlns:context="http://www.springframework.org/schema/context" 6 xml
2017-04-04 09:16:17 684
转载 使用方法拦截器MethodInterceptor和AOP统一处理log
对每个接口的请求记录log的方法有很多种,比如用filter、mvc interceptor、method interceptor等。如果需要记录请求消息的payload,前两种不适用。下面介绍第三种的实现方法。第一步:引入包依赖[java] view plain copy "font-family: Arial, Helvetica, sans-ser
2017-04-03 18:36:42 376
转载 Spring 中配置log4j日志功能
一,添加log4j依赖包可从官网上下载该依赖包log4j-x.x.xx.jar,下载后 build path,添加依赖包 二,创建 log4j.properties 配置文件log4j.properties配置文件用来配置 日志的输出格式、输出的地址....### set log levels ###log4j.rootLogger = INFO, D, Elog
2017-04-03 16:17:21 1844
转载 MyBatis的分页操作(MySQL)
.无条件分页:xml version="1.0" encoding="UTF-8"?>DOCTYPE mapper PUBLIC "-//mybatis.org//DTD Mapper 3.0//EN" "http://mybatis.org/dtd/mybatis-3-mapper.dtd">namespace写成类的全限定名有好处,在Dao中方便-->map
2017-04-02 16:43:30 366
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人