- 博客(5)
- 资源 (13)
- 收藏
- 关注
原创 基于情感词典的情感打分
原理我就不讲了,请移步下面这篇论文,包括情感词典的构建(各位读者可以根据自己的需求稍作简化),以及打分策略(程序对原论文稍有改动)。论文在这里下载:基于情感词典的中文微博情感倾向性研究-陈晓东-华中科技大学 (大家可以上百度学术搜索下载)本文采用的方法如下: 首先对单条微博进行文本预处理,并以标点符号为分割标志,将单条微博分割为n个句子,提取每个句子中的情感词 。以下两步的处理均以...
2015-06-29 21:01:18 37334 96
原创 Textrank权值提取文本标签提取
我已经爬取到了指定博主的新浪微博,然后我想从微博中提取出可以代表该博主兴趣特征的100个关键词,然后由这100个关键词提取出10个标签,代表博主的兴趣。我们此处使用基于Textrank权值的关键词提取方法。输入:微博文本集合,如下图(每一行一条微博) 程序原理如下:(请勿抄袭和转载) 程序如下:# -*- coding: utf-8 -*-__author__ = 'Bai C
2015-06-29 21:20:40 6356
原创 网易新闻评论爬虫(python+selenium+PhantomJS)
警示:请勿转载内容网易新闻评论爬虫设计废话不多说,我们要爬取这样一个网易的新闻评论页面,页面URL如下:url = "http://comment.news.163.com/news3_bbs/APLP5TVS00014JB6.html" 这是动态网页,下载网页源代码后是无法直接解析出内容的,我们需要用浏览器内核去解析源代码,直接得到正文。这是一种偷懒的技术,但是可以帮助我们快速获取数据。当然这种方
2015-06-29 20:31:32 2992 2
原创 MATLAB学习笔记(九)
本章主要学习以下内容----------**1. 理解MATLAB不同类型的数据****2. 创建和使用数值型和字符型数组****3. 创建多维数组并能从这些数组中访问数据****4. 创建和使用元胞数组和结构数组**
2015-06-03 10:56:20 2323
原创 Python列表切片详解([][:][::])
Python切片是list的一项基本的功能,最近看到了一个程序,里面有这样一句类似的代码:a = list[::10]不太明白两个冒号的意思就上网百度,发现大多数人写的博客中都没有提到这一个用法,因此自己翻阅《Python核心编程中文版(第二版)》教材,找到了Python切片的这一部分。教材中写的非常详细,我将主要内容摘录到博客中,以便大家查阅。
2015-06-01 17:08:35 96810 8
双目立体标定与测量
2016-10-10
基于情感词典的情感倾向打分
2015-06-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人