自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Claire_Bear7的专栏

克莱尔小熊的专栏。。。

  • 博客(14)
  • 收藏
  • 关注

原创 微博舆情 之 特定话题情感分析

本文介绍一下在做微博特定话题情感分析中的做法,核心就是判断文本的情感极性,再根据这个极性来进行情感判定。

2015-06-30 22:22:43 6277

原创 微博舆情 之 热点话题分析

主要流程在热点话题发现中,主要的流程如下: 在微博流中加入一个时间窗,从时间窗开始处累计微博,直到时间窗的结尾,然后对这个时间窗内的微博进行特征抽取,得到能表示微博的词语,并转化为特征空间中的特征向量;然后利用凝聚式层次聚类算法对文档集合聚类,得到候选话题簇,然后利用 SinglePass 算法判断每个候选话题和历史话题的相似度,如果最大相似度小于阈值,则认为候选话题是一个新话题并把这个候选话题转

2015-06-25 16:08:48 13062 2

转载 一文读懂机器学习,大数据/自然语言处理/算法全有了……

从机器学习谈起  在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇,从这里开始,必须对机器学习了解才能进一步介绍EasyPR的内核。当然,本文也面对一般读者,不会对阅读有相关的前提要求。  在进入正题前,我想读者心中可能会有一个疑惑:机器学习有什么重要性,以至于要阅读完这篇非常

2015-06-23 20:54:53 2623

原创 推荐系统

这篇文章列一下发现的比较好的讲推荐系统的文章探索推荐引擎内部的秘密

2015-06-23 20:48:21 720

原创 微博舆情 之 自然语言处理

这篇主要讲一下如何将微博转化成一个个特征向量。

2015-06-23 20:45:55 7865

原创 Leetcode 之 Find Minimum in Rotated Sorted Array

Suppose a sorted array is rotated at some pivot unknown to you beforehand (i.e., 0 1 2 4 5 6 7 might become 4 5 6 7 0 1 2). Find the minimum element. You may assume no duplicate exists in the array.

2015-06-22 00:45:28 521

原创 Leetcode 之 Word Search

Given a 2D board and a word, find if the word exists in the grid.The word can be constructed from letters of sequentially adjacent cell, where “adjacent” cells are those horizontally or vertically neig

2015-06-20 11:29:33 622

原创 微博舆情 之 数据获取

这篇主要讲一下当时获取微博内容时所采用的方法。

2015-06-20 10:59:53 5217

原创 微博舆情分析

微博是从13年暑假做的,前前后后经历了3个月,从需求分析到最终在学校上线,算是数据挖掘和大数据的启蒙项目了。记得当时Team所有人都处于理论学习刚出师的阶段,所以就选择了当时研究微博比较火的几个方向:热点话题发现、特定话题情感分析,社交网络发现 这几个功能,由于时间的问题,最终只完成了前面两个,但是其中在NLP、特征提取、数据挖掘算法和数据分析流程等方面确实学到了很多。

2015-06-18 15:24:42 10421 2

原创 Leetcode 之 Remove Duplicates from Sorted Array II

Follow up for “Remove Duplicates”: What if duplicates are allowed at most twice?For example, Given sorted array nums = [1,1,1,2,2,3],Your function should return length = 5, with the first five elemen

2015-06-17 22:06:48 519

原创 LeetCode之Remove Duplicates from Sorted Array

Given a sorted array, remove the duplicates in place such that each element appear only once and return the new length.Do not allocate extra space for another array, you must do this in place with cons

2015-06-17 20:46:37 493

转载 Emacs之Org-mode

Org-Mode相关命令

2015-06-17 11:39:39 448

转载 Emacs之Windows版本配置

Emacs之Windows版本配置

2015-06-17 11:09:42 1121

原创 LeetCode 之 Divide Two Integers

LeetCode 之 Divide Two Integers Divide two integers without using multiplication, division and mod operator. If it is overflow, return MAX_INT.

2015-06-17 00:07:08 520

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除