腾讯,新浪微博模拟登录爬取数据 程序 ,无偿奉献了(java版本)

要毕业了,看到好多人在研究新浪,腾讯微博的模拟登录获取数据的方法。我刚开始也 费了一番力气,从2011年暑假就开始分析,当时腾讯微博的登录验证还是采用md5处理,而新浪微博是用sha1。现在二者都做了变化。做数据挖掘的人,不该把心思放在数据源上哇,哎。。。。当时我分析和写程序就写了快两个月凡是...

2013-05-28 17:03:58

阅读数 64

评论数 0

memcache 之windows下的使用

memcached 是一个高效的分布式的内存对象缓存系统 ,他可以支持把各种数据(数组,对象,基本数据类型,资源除外)放入到它管理的内存中。它采用c/s结构,使用简单文本通讯并 基于libevent处理并发,将数据存入内存的缓存工具,它是基于 基于客户端的分布式,服务器端本身并不是分布式的。 ...

2013-03-07 10:55:09

阅读数 21

评论数 0

nodejs 之模拟登录

最近看了 nodejs开发指南这本书,并参照着 nodejs.org官方网站中的 api,写了一个 模拟登录程序,其中有 北邮人论坛的,有 163邮箱的。其中前者 只需post就可以了,居然是明文传输,也不用https。后者选择了https,通过抓发分析,写了如下程序,另外,还学习了 通过Nod...

2013-01-15 17:11:42

阅读数 31

评论数 0

java构造方法与成员初始化分析

package ibm; public class TestConstructor{ public static void main(String[] args) { Drived drived=new Drived(); System.out.println(drived...

2012-11-14 10:11:44

阅读数 28

评论数 0

智力题

http://blog.csdn.net/haoni123321/article/details/7179062

2012-10-08 10:45:38

阅读数 10

评论数 0

用GEPHI绘制的 我的微博 好友 关系 与 好友的好友关系图

下图中:点表示一个用户。 我关注的用户 会有 一条 由我指向 到该点的边。最中心的点是我自己。 同样,我好友的好友即为  好友->好友的好友的边。   下边两幅图 均为由 gephi所绘制,我共关注了 134个人,而我好友的好友 共有点 51503个,边66651条....

2012-09-29 20:44:51

阅读数 35

评论数 0

(转)One Class Collaborative Filtering 单类协同过滤

YangQiang教授指导的这篇ICDM2008的文章我2年前就拜读过,但当初对上面的方法不是特别感冒,所以也就没有记得特别清楚。最 近,KDD Cup的第二个track的问题和这篇Paper的研究问题很像,同时我在做KDD Cup时也设计了一个算法,感觉效果非常好,我准备把他称作基于采样的...

2012-09-29 20:35:46

阅读数 17

评论数 0

linux入门常用命令

Linux命令行技巧 来源:linuxstall.com | 作者:Chankey Pathak  下面我将和大家分享一些学习Linux命令行的技巧,希望能对大家有所助益。如果在本文中遇到不太熟悉的命令,可以在终端中键入以下命令寻求帮助。 Man <comm...

2012-05-30 16:54:00

阅读数 11

评论数 0

单链表的逆序

给定一个单链表,如何实现单链表的逆序排列。 伪码如下:   reverse(headNode): p=head; q=head->next; p->next=null; while(q...

2012-05-30 16:53:22

阅读数 8

评论数 0

浅谈servlet

一个Servlet的生命周期如下: 1 如果在容器配置文件web.xml中设置了load-on-startup字段,则表示容器在启动时就会自动创建servlet的实例,同时执行其init方法。 <servlet> <...

2012-05-30 12:43:05

阅读数 9

评论数 0

支持向量机(SVM)基础

 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com   前言:      关于SVM的论文、书籍都非常的多,“SVM是让应用数学家真正得到应用的一种算法”。SVM对于大部分的普通人来说,要完全理解其中的数学是非常困难的,所以要让这些普通人理解,得要...

2012-05-29 10:18:09

阅读数 9

评论数 0

flex页面初始化后,无法聚焦文本框

转自 :博客园 Flex页面初始化creationComplete事件中,加入焦点设置语句 : focusManager.setFocus("TextInput组件ID"); 页面运行后并看不到效果,将焦点设置语句放到按钮事件中,TextInput倒是焦点设...

2012-05-28 19:54:37

阅读数 19

评论数 0

[转】mahout 推荐引擎的相关介绍,理解,如何应用

Mahout 简单使用经验 mahout项目介绍 推荐引擎利用特殊的信息过滤技术,将不同的内容(例如电影、音乐、书籍、新闻、图片、网页等)推荐给可能感兴趣的用户。通常情况下,推荐引擎的实现是通过将用户的个人喜好与特定的参考特征进行比较,并试图预测用户对一些未评分项目的喜好程度。参考特征...

2012-05-15 19:57:04

阅读数 8

评论数 0

python 读写XML

<一 python读XML文件> 转自http://hi.baidu.com/heelenyc/blog/item/4062fd0b57c75294d1581b09.html Python处理XML  使用python开发时,由于pyth...

2012-05-09 21:10:10

阅读数 11

评论数 0

一道百度算法笔试小题

昨天陪同学在北大,发现百度在笔试招实习生,现场笔试。顺道也霸笔了一把。有这样一道小题,一个数组a,                    a[0,1....mid-1]是有序的,a[mid,.....num]也是有序的,现在要把这两部进行merge,如何在空间复杂度为0(1)的情况下进行合并,使得...

2012-05-07 11:41:17

阅读数 9

评论数 0

透过源码和实例学习CountDownLatch类

最近在做一个程序的 时候遇到了这样的情况,在 主类中需要执行一些操作,同时主类会启动几个线程,在这些线程执行前和执行后都会一系列的操作。因此就用到了CountDownLatch类。CountDownLatch是一个同步辅助类,在完成一组正在其他线程中执行的操作之前,它允许一个或多个线程一直等待。 ...

2012-04-23 10:03:56

阅读数 7

评论数 0

一套笔试小题

有这样一道笔试题目,请问str1,str2,str3,str4的执行效率如何排序的? String str1="1"+"2"+"3"+"4"+&...

2012-04-17 16:56:00

阅读数 6

评论数 0

基于用户投票的排名算法(转播)

基于用户投票的排名算法(一):Delicious和Hacker News   互联网的出现,意味着"信息大爆炸"。   用户担心的,不再是信息太少,而是信息太多。如何从大量信息之中,快速有效地找出最重要的内容,成了互联网的一大核心问题。   各种各样的...

2012-04-03 21:11:19

阅读数 13

评论数 0

SSH原理与运用(转:阮一峰)

SSH原理与运用(一):远程登录 SSH是每一台Linux电脑的标准配置。 随着Linux设备从电脑逐渐扩展到手机、外设和家用电器,SSH的使用范围也越来越广。不仅程序员离不开它,很多普通用户也每天使用。 SSH具备多种功能,可以用于很多场合。有些事情,没有它就是办不成。本文是我...

2012-04-03 21:09:12

阅读数 16

评论数 0

jdom解析xml抛出Invalid byte 2 of 2-byte UTF-8 sequence.异常的解决方法

最近做一个项目的时候,老是报com.sun.org.apache.xerces.internal.impl.io.MalformedByteSequenceException: Invalid byte 2 of 2-byte UTF-8 sequence.异常,经过仔细排查发现,是xml解析的时...

2012-04-01 22:33:48

阅读数 36

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭