gsp_2015-CSDN博客

原创 jsoncpp构造json字符串和json数组

jsoncpp构造json字符串和json数组参考文章：Jsoncpp的简单使用下载json文件夹放在c++项目的include目录下，在CMakeLists中include进去，然后就可以在代码中加入#include “json/json.h”使用啦。下载地址：https://github.com/open-source-parsers/jsoncpp/tree/master/include。

2015-12-03 16:37:42 11983

原创社交媒体中的谣言检测(A11, AAAI2015)

Towards Detecting Rumours in Social Media 社交媒体中的谣言检测(A11, AAAI2015)文章结果表明本文可以有效收集社交媒体中一系列故事的谣言，基于需要手动输入谣言特定关键词的现有技术这可能比较困难。文章引入了一个新颖的方法建立社交媒体谣言和非谣言数据集作为事件展开。

2015-11-30 10:16:48 3231

原创词嵌入

词嵌入维基百科上关于词嵌入的定义：Word embedding是一组语言模型和自然语言处理中特征学习技术的的总称，词汇中的单词（也可能是短语）被映射到相对于词汇量的大小（“连续空间”）而言低维空间的实数向量。参考文章：《How to Generate a Good Word Embedding?》导读语料对词向量的影响比模型的影响要重要得多，语料越纯越好。

2015-11-24 15:50:55 7679

原创限制玻尔兹曼机（RBM）

限制玻尔兹曼机（RBM）参考文章：能量模型(EBM)、限制波尔兹曼机(RBM)产生式模型：用来估计联合概率P(x,y), 因此可以根据联合概率来生成样本，如HMM；判别式模型：用来估计条件概率P(y|x)，只能判断分类，如SVM，CRF，MEM(最大熵)。玻尔兹曼机（BM）是一种特殊的基于能量的模型（Energy Based Model，EBM）。

2015-11-16 10:49:51 1732

原创 CRF

CRF参考文章：CRF学习离散马尔科夫过程，即当前所处的状态仅与它之前的一条状态有关。最大熵模型的实质是，在已知部分知识的前提下，关于未知分布最合理的推断是符合已知知识的最不确定或最随机的推断，这是我们可以做出的唯一一个不偏不倚的选择。参考文章：……

2015-11-02 09:22:09 1082

原创卷积神经网络（CNN）

卷积神经网络（CNN）参考文章：卷积神经网络（CNN）卷积神经网络（Convolutional Neural Networks）神经元间的连接是非全连接的（稀疏连接），同一层中某些神经元之间的连接权重是共享的（即相同的）。为什么要权重共享呢？

2015-10-26 11:26:46 2058

原创神经网络

神经网络参考文章：机器学习算法汇总：人工神经网络、深度学习及其它人工神经网络算法模拟生物神经网络，是一类模式匹配算法。

2015-10-24 16:13:36 1129

原创 Joint Sentiment/Topic Model & Aspect and Sentiment Unification Model

Joint Sentiment/Topic Model & Aspect and Sentiment Unification Model参考文章：Joint Sentiment/Topic Model for Sentiment Analysis JST模型从文本检测情感和主题之前的工作缺点：基于机器学习的情感分类需要大量的人工标记；一个领域训练的情感分类模型不能很好地应用于另一个领域；主

2015-10-23 19:19:34 1604

原创《Parameter estimation for text analysis》阅读笔记

《Parameter estimation for text analysis》阅读笔记

2015-10-21 16:34:44 3158

原创 SVM&TSVM&LSA(I)→PLSA(I)→LDA→HDP

SVM&TSVM&LSA(I)→PLSA(I)→LDA→HDPSVM（用于监督学习）参考文章：SVM（支持向量机）详解通俗来讲，SVM是一种二类分类模型，其基本模型定义为特征空间上的间隔最大的线性分类器，即支持向量机的学习策略便是间隔最大化，最终可转化为一个凸二次规划问题的求解。高维空间的小样本学习。SVM解决问题的时候，和样本的维数是无关的。寻求经验风险与置信风险的和最小，即结构风险最小

2015-10-16 16:10:42 4102

原创 eclipse下工程导成jar包运行报错，解决方法

eclipse下工程导成jar包运行报错，解决方法在eclipse下运行正常，但导成jar包，在终端运行java -jar modulexxx.jar报错：解决方法：在java工程上右键Export时，选择Runnable JAR file，而不是JAR file。

2015-10-08 21:19:43 2738

原创半监督情感分类的主动深度学习方法（Neurocomputing2013）

半监督情感分类的主动深度学习方法（Neurocomputing2013） Active deep learning method for semi-supervised sentiment classification文章提出主动深度网络（ADN）的半监督学习框架。ADN用基于标记评论和充足非标记评论的非监督学习的限制玻尔兹曼机（RBM）建立。随后，构建的架构通过基于监督学习指数损失函数的梯度下降微

2015-10-08 10:26:53 3774

原创 c++ & java解析JSON格式数组

c++ & java解析JSON格式数组c++解析JSON格式数组参考文章：http://blog.hehehehehe.cn/a/17907.htm，http://blog.csdn.net/u010319687/article/details/39345053，http://rapidjson.org/zh-cn/md_doc_features_8zh-cn.html。

2015-10-06 11:54:44 3593

原创 java使用JDBC连接MYSQL数据库

java使用JDBC连接MYSQL数据库参考文章：http://outofmemory.cn/code-snippet/1085/java-usage-JDBC-connection-MYSQL-database。具体使用步骤：需要下载外部jar包：mysql-connector-java-5.1.22.jar。

2015-10-06 10:42:09 867

原创 java解析XML配置文件及log4j开源日志系统

java解析XML配置文件及log4j开源日志系统java解析XML配置文件参考文章：http://blog.csdn.net/magister_feng/article/details/7454367和http://freewxy.iteye.com/blog/981000。

2015-10-06 10:20:15 1158

原创半监督情感分类的模糊深度信任网络（Neurocomputing2014）*

半监督情感分类的模糊深度信任网络（Neurocomputing2014） Fuzzy deep belief networks for semi-supervised sentiment classification文章首先通过训练集上的半监督学习训练通常的深度信任网络（DBN）。然后基于学习的深度框架，为每类评论设计一个模糊成员函数。其次，基于模糊成员函数和第一步获得的DBN，建立新的FDBN框架

2015-10-05 16:40:58 2126

原创学习微博中情感分类的句子表达（NLPCC2013）

学习微博中情感分类的句子表达（NLPCC2013） Learning sentence representation for emotion classification on microblogs文章采用伪标记数据，来通过深度信任网络（DBN）算法学习句子表达。数据是通过微博情感分析中弱监督学习和训练语言模型得到。在监督学习框架上的实验结果表明，使用伪标记数据，深度信任网络学到的表达比基于主成分分

2015-10-04 17:12:24 4802

原创利用社会关系进行微博情感分析（A10, WSDM2013）

Exploiting social relations for sentiment analysis in microblogging 利用社会关系进行微博情感分析（A10, WSDM2013）文章通过提出一个社会学方法处理情感分类的噪声短文本（SANT）研究社会关系是否可以帮助情感分析。特别地，提出一个数学优化构想，引入情感一致性和情感传播理论到监督学习过程，同时利用稀疏学习处理微博中的噪声文本。

2015-09-24 11:04:18 1859

原创学习微博情感分类的特定情感词嵌入（A14, ACL2014）*

Learning sentiment-specific word embedding for twitter sentiment classification 学习微博情感分类的特定情感词嵌入（A14, ACL2014）文章提出了一个学习微博情感分类的词嵌入方法。大多数现存算法只对词的上下文句法结构建模学习连续词表达，忽略了文本情感。

2015-09-23 15:41:49 3479 1

原创 Moodlens：一个基于表情符号的中文微博情感分析系统（A3, SIGKDD2012）

Moodlens: an emoticon-based sentiment analysis system for chinese tweets Moodlens：一个基于表情符号的中文微博情感分析系统（A3, SIGKDD2012）文章建立了一个叫Moodlens的系统，是微博上第一中文微博情感分析系统。在Moodlens中，95个表情符号对应四个情感类：生气，厌恶，喜悦和悲伤，作为微博的类标签。

2015-09-22 17:17:22 4934

原创微博情感分析的表情符号平滑语言模型（A11, AAAI2012）

Emoticon Smoothed Language Models for Twitter Sentiment Analysis 微博情感分析的表情符号平滑语言模型（A11, AAAI2012）通常，对于完全监督模型，由于耗人力和耗时间只能得到有限的训练数据，对于带噪声标签的模型，虽然很容易获得大量训练数据，但是由于标签的噪声很难得到满意的性能。最好的策略是利用手工标记的数据和噪声数据来训练。

2015-09-22 16:53:17 2584

原创评估文本评论情感分析的机器学习和非监督语义倾向性方法（IEEE2012）

Evaluating Machine Learning and Unsupervised Semantic Orientation Approaches for Sentiment Analysis of Textual Reviews 评估文本评论情感分析的机器学习和非监督语义倾向性方法（IEEE2012）文章中情感分析问题可以形式上定义为：给定一个文档集D，情感分类算法划分文档集中的每一个文档为

2015-09-19 11:48:10 3837

原创关于thrift java实例入门

准备先运行成功一个简单的thrift java实例。

2015-09-09 17:45:28 1152

原创使用非监督学习技术分析情感（IEEE2013）

Analysis of sentiments using unsupervised learning techniques 使用非监督学习技术分析情感（IEEE2013）文章提出了一个新的模型：组合情感话题模型（CST）来同时检测文本的情感和话题。这个模型基于Gibbs采样算法。当转移到其他域时，观点挖掘的监督方法经常不能产生好的性能。不同于监督方法，CST的非监督性质使它高度可移植到其他域。

2015-08-27 17:54:03 2592

原创西方在线新闻的自动观点分类架构（IEEE2014）

An architecture for automatic opinion classification in Western online news 西方在线新闻的自动观点分类架构（IEEE2014）自动情感分析系统架构包含：（1）中英文等价查询表达式的识别；（2）域和语言学知识基的构建；（3）新闻事件的重获；（4）新闻文本的情感分析。工作流包含两个阶段：离线资源的构建，在线新闻文本分析。

2015-08-27 11:31:17 894

原创基于用户社会影响建模的情感识别系统框架（IEEE2014）

A Systematic Framework for Sentiment Identification by Modeling User Social Effects 基于用户社会影响建模的情感识别系统框架（IEEE2014）在社会平台中，用户与社会品牌交互，他们对于特定话题的观点不可避免地依赖于许多社会影响如用户话题偏好，同伴影响，用户资料信息等。文章提出一个系统框架，除了文本信息，引入用户社会影响。

2015-08-26 11:23:56 1025

原创通过网络挖掘检测谣言和误信息（2015）

Detecting Rumor and Disinformation by Web Mining 通过网络挖掘检测谣言和误信息（2015）文章基于网络挖掘和比较两个文本段落的语言技术，提出了一个检测给定文本是否是谣言或误信息的方法。通过内容产生算法，从真实文本的一部分产生误信息。提出一个误信息检测算法，采用分析森林技术，找到网络上的一个文本候选源，与给定的文本比较。分析森林是结合一系列句子间指代和修

2015-08-25 17:57:26 2498

原创通过人群响应进行中文谣言检测（IEEE2014）

Rumors Detection in Chinese via Crowd Responses 通过群众响应进行中文谣言检测（IEEE2014）不同于之前的使用微博固有的特征进行检测谣言的研究，本文转移前提，关注于通过从特定社会事件的群众响应：转帖和评论提取特征识别事件谣言。文章中，使用文本分析和自然语言处理技术分析转帖和评论文本来自动划分错误信息和有效信息。

2015-08-25 14:30:29 1936

原创社会媒体中的谣言分析框架（IEEE2011）

Rumor analysis framework in social media 社会媒体中的谣言分析框架（IEEE2011）文章提出的框架阐明了社会媒体中的话题，可视化时间序列变量上的话题结构。然后提取谣言候选，从其他媒体比如电视节目、报纸等寻找相关信息来证实谣言候选的可信度。通过这一框架，可以显示潜在谣言。在谣言信息出现之前，没有像新闻或电视节目的可信信息源。文章提出的框架，没有以特定的商品

2015-08-24 17:38:48 1451

原创识别微博的误信息（ACM2011）

Rumorhas it: Identifying Misinformation in Microblogs识别微博的误信息（ACM2011）文章提出微博谣言监测的问题，探索3类正确识别谣言的特征的有效性：基于内容，基于网络和微博指定模式。本文的工作不同于前人，前人关注于从一个相关短语的语料中识别谣言。本文尝试进一步辨别短语：确认，反驳，质疑和简单谈论谣言。本文工作的目标是两方面的：（1

2015-08-24 15:53:20 1077

原创基于网页可信特征的信息可信度评估方法（IEEE2011）

Evaluation Method of Information Credibility Basedon the Trust Features of Web Page基于网页可信特征的信息可信度评估方法（IEEE2011）文章引入基于网页可信特征的信息可信度评估方法。根据网页特征预定义可信特征后，建立信息可信度评估标准。最后，可信度的参考值可以通过可信度评估计算获得。可信特征（1）

2015-08-21 19:10:19 2766

原创关联网页可信度分析和文本内容（IEEE2014）

Credibility Microscope: Relating Web PageCredibility Evaluations to Their Textual Content关联网页可信度分析和文本内容（IEEE2014）文章主要目标：研究网页内容在什么程度上决定它的可信度评估。这一目标通过实验来实现。实验中，让受访者给网页可信度和网页上每条陈述的可信度、重要性打分。制定了许多网页和陈

2015-08-21 15:05:09 1125

原创基于结构分析的句子语义倾向性计算算法（IEEE2013）

SentenceSemantic Orientation Calculation Algorithm based on StructureAnalysis基于结构分析的句子语义倾向性计算算法（IEEE2013）文章中，文本主题倾向性不仅通过词倾向性，而且通过句子结构来计算，提出了情感提交算法（ES）来计算句子主题倾向性。该方法适用于商品评论。计算文本倾向性，主题描述和句子结构需要同

2015-08-20 17:04:17 1210

原创中文情感倾向性分析（IEEE2010）

Chinese Sentiment Orientation Analysis中文情感倾向性分析（IEEE2010）文章提出了一个新方法分析、划分商品评论的情感倾向性为3类：中立，积极和消极。目前的方法对于中立态度的句子不能得到好的划分结果。文章首先采用分治策略划分文本为2类：中立和极性文本，然后极性文本分为积极部分和消极部分（两层分类系统）。在第一步中，使用TSVM（直推式SVM）工具实现

2015-08-20 11:22:35 4088 1

原创基于改进依赖分析的微博情感倾向性分析

Research on micro-blog sentiment orientation analysisbased on improved dependency parsing基于改进依赖分析的微博情感倾向性分析（IEEE2013）文章基于分析微博文本的特性，提出了一个新的改进依赖分析方法分析来分析微博的情感倾向性。改进的算法包括表情符号和标点符号的情感倾向性分析，通过基于距离语法结

2015-08-19 21:04:30 1392

ABCD2010014357的博客