- 博客(14)
- 收藏
- 关注
原创 微博舆情 之 热点话题分析
主要流程在热点话题发现中,主要的流程如下: 在微博流中加入一个时间窗,从时间窗开始处累计微博,直到时间窗的结尾,然后对这个时间窗内的微博进行特征抽取,得到能表示微博的词语,并转化为特征空间中的特征向量;然后利用凝聚式层次聚类算法对文档集合聚类,得到候选话题簇,然后利用 SinglePass 算法判断每个候选话题和历史话题的相似度,如果最大相似度小于阈值,则认为候选话题是一个新话题并把这个候选话题转
2015-06-25 16:08:48 13062 2
转载 一文读懂机器学习,大数据/自然语言处理/算法全有了……
从机器学习谈起 在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇,从这里开始,必须对机器学习了解才能进一步介绍EasyPR的内核。当然,本文也面对一般读者,不会对阅读有相关的前提要求。 在进入正题前,我想读者心中可能会有一个疑惑:机器学习有什么重要性,以至于要阅读完这篇非常
2015-06-23 20:54:53 2623
原创 Leetcode 之 Find Minimum in Rotated Sorted Array
Suppose a sorted array is rotated at some pivot unknown to you beforehand (i.e., 0 1 2 4 5 6 7 might become 4 5 6 7 0 1 2). Find the minimum element. You may assume no duplicate exists in the array.
2015-06-22 00:45:28 521
原创 Leetcode 之 Word Search
Given a 2D board and a word, find if the word exists in the grid.The word can be constructed from letters of sequentially adjacent cell, where “adjacent” cells are those horizontally or vertically neig
2015-06-20 11:29:33 622
原创 微博舆情分析
微博是从13年暑假做的,前前后后经历了3个月,从需求分析到最终在学校上线,算是数据挖掘和大数据的启蒙项目了。记得当时Team所有人都处于理论学习刚出师的阶段,所以就选择了当时研究微博比较火的几个方向:热点话题发现、特定话题情感分析,社交网络发现 这几个功能,由于时间的问题,最终只完成了前面两个,但是其中在NLP、特征提取、数据挖掘算法和数据分析流程等方面确实学到了很多。
2015-06-18 15:24:42 10421 2
原创 Leetcode 之 Remove Duplicates from Sorted Array II
Follow up for “Remove Duplicates”: What if duplicates are allowed at most twice?For example, Given sorted array nums = [1,1,1,2,2,3],Your function should return length = 5, with the first five elemen
2015-06-17 22:06:48 519
原创 LeetCode之Remove Duplicates from Sorted Array
Given a sorted array, remove the duplicates in place such that each element appear only once and return the new length.Do not allocate extra space for another array, you must do this in place with cons
2015-06-17 20:46:37 493
原创 LeetCode 之 Divide Two Integers
LeetCode 之 Divide Two Integers Divide two integers without using multiplication, division and mod operator. If it is overflow, return MAX_INT.
2015-06-17 00:07:08 520
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人