自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 Apache POI工具对excel文件操作的简单使用

今天帮一个同学,处理txt文件数据,最后把数据持久化到excel表格中,其中用到了开源工具包POI,稍微学习了下,mark。。。1、首先是一个创建xls文件的demopackage test;import java.io.FileOutputStream;import java.io.IOException;import org.apache.poi.hssf.usermodel

2015-04-24 23:05:09 410

翻译 《Who is Tweeting on Twitter: Human, Bot, or Cyborg》重点翻译

摘要:1)大规模测量:微博行为,微博内容,账号属性2)构建分类系统:有四部分组成一个基于熵的组件;一个基于机器学习的组件;一个账户属性组件;一个决策器。关键字:自动识别,机器,半机器,twitter1、引言论文目的:特征化微博用户自动化特征,并且将用户分为三类(人,机器,半机器)分类器组成:一个基于熵的组件:用微博发布间隔作

2014-07-04 22:32:39 810

转载 线性判别分析

1. 问题     之前我们讨论的PCA、ICA也好,对样本数据来言,可以是没有类别标签y的。回想我们做回归时,如果特征太多,那么会产生不相关特征引入、过度拟合等问题。我们可以使用PCA来降维,但PCA没有将类别标签考虑进去,属于无监督的。     比如回到上次提出的文档中含有“learn”和“study”的问题,使用PCA后,也许可以将这两个特征合并为一个,降了维度。但假设我们的

2014-07-03 15:33:57 862

转载 Logistic regression概述

Logistic regression (逻辑回归)是当前业界比较常用的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。(注意这里是:“可能性”,而非数学上的“概率”,logisitc回归的结果并非数学定义中的概率值,不可以直接当做概率值来用。该结果往往用于和其他特征值加权求和,而非直接相乘)那么它究竟是什么

2014-06-19 10:43:52 466

转载 如何辨别僵尸粉--利用信息熵、图灵测试和数字化社会网络

僵尸假扮人类、人类识别僵尸似乎会成为“魔高一尺道高一丈”的拉锯战,至少在数字化社会网络时代将长期如此【引言】写这篇文章的时候苹果还没发布Siri,现在理解僵尸粉或者说cyborg的进化以前更简单了,只要想想“人们为什么热衷于与Siri的互动,这种互动与真实人类的互动有何不同”。在“僵尸粉”的围攻下,新浪微博似乎正在被僵尸占领、并逐渐失去对普通用户的吸引力,在微博平台、广告商

2014-06-19 10:27:52 1549

原创 几个主要的分类算法

摘要:数据挖掘是目前一种新的重要的研究领域。本文介绍了数据挖掘的概念、目的、常用方法、数据挖掘过程、数据挖掘软件的评价方法。对数据挖掘领域面临的问题做了介绍和展望。  关键词:数据挖掘 数据集合  1. 引言  数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。随着

2014-06-19 10:25:20 1868

转载 分析社交网络的一些方法和工具

作者为@SocialBeta 内容贡献者@曹宇Charlie 。第一部分 关于定位的问题大多数我们所了解的社会化网络,都是从一个相对较小的起点发展起来的。有时候,我们常把一个有特色的起点,看做是这个社交网络的初始定位(初始定位,与后来发展壮大后的定位,应区别看待)。既然是定位,我们知道它指的是差异化的问题,也就是,我们如何找到一个与众不同的点,来吸引第一批铁杆用户,并依靠这第一批用

2014-06-19 10:14:27 1165

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除