自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(1)
  • 资源 (24)
  • 收藏
  • 关注

转载 爬虫伪装方法

原文:http://pisces-java.iteye.com/blog/1471651 最近因为业务需要,要将豆瓣上的图书以及影视信息抓取下来,网页抓取其实很简单,很快就完成,但是系统还没上线就发现了问题,豆瓣会根据请求分析客户的行为,判断是否是机器人,如果判断为机器人,将要求输入验证码,最终导致抓取不到数据。 要解决这个问题,主要就两个思路,一个是识别验证码,当要求输入验证码时

2013-05-29 20:40:10 3814 1

推荐系统的循序进阶读物

1. 中文综述(了解概念-入门篇) a) 个性化推荐系统的研究进展 b) 个性化推荐系统评价方法综述 2. 英文综述(了解概念-进阶篇) a) 2004ACMTois-Evaluating collaborative filtering recommender systems b) 2004ACMTois -Introduction to Recommender Systems - Algorithms and evaluation c) 2005IEEEtkde Toward the next generation of recommender systems - A survey of the state-of-the-art and possible extensions 3. 动手能力(实践算法-入门篇) a) 2004ACMtois Item-based top-N recommendation algorithms.pdf (协同过滤) b) 2007PRE Bipartite network projection and personal recommendation.pdf (网络结构) 4. 动手能力(实践算法-进阶篇) a) 2010PNAS-Solving the apparent diversity-accuracy dilemma of recommender systems.pdf (物质扩散和热传导) b) 2009NJP Accurate and diverse recommendations via eliminating redundant correlations.pdf (多步物质扩散) c) 2008EPL Effect of initial configuration on network-based Recommendation.pdf (初始资源分配问题) 5. 推荐系统扩展应用(进阶篇) a) 2009EPJB Predicting missing links via local information.pdf (相似性度量方法) b) 2010theis-Evaluating Collaborative Filtering over time.pdf (基于时间效应的博士论文) c) 2009PA Personalized recommendation via integrated diffusion on user-item-tag tripartite graphs.pdf (基于标签的三部分图方法) d) 2004LNCS Trust-aware collaborative filtering for recommender systems.pdf (基于信任机制) e) 1997CA-Fab_content-based, collaborative recommendation.pdf (基于文本信息) 6. 推荐结果的解释(进阶篇) a) 2000CSCW-Explaining Collaborative Filtering Recommendations.pdf b) 2011PRE-Information filtering via biased heat conduction.pdf c) 2011PRE- Information filtering via preferential diffusion.pdf d) 2010EPL Link Prediction in weighted networks - The role of weak ties e) 2010EPL-Solving the cold-start problem in recommender systems with social tags.pdf 7. 推荐系统综合篇(专著、大型综述、博士论文) a) 2005Ziegler-thesis-Towards Decentralized Recommender Systems.pdf 2010Recommender Systems Handbook.pdf

2013-03-21

Hadoop下的分布式搜索引擎

Hadoop下的分布式搜索引擎

2013-03-05

Dalvik虚拟机内存管理

Dalvik虚拟机内存管理

2013-03-05

图像特征特点及其常用的特征提取与匹配方法

图像特征特点及其常用的特征提取与匹配方法

2012-12-26

Google的秘密PageRank彻底解说中文版

Google的秘密PageRank彻底解说中文版

2012-12-13

数学建模算法全收录

数学建模算法全收录,非常好的数学建模算法,包含常见的算法!!!

2012-12-13

(毕业设计)(毕业论文)车辆管理系统ASP+ACCESS

此毕业设计为车辆管理系统 采用ASP+ACEESS数据库执行 文件夹内为完整源代码

2012-03-15

数据挖掘入门PPT集合(英文)

数据挖掘 data mining 算法 简单易懂生动

2011-12-21

结网-互联网产品经理改变世界-第二版

结网-互联网产品经理改变世界-第二版 结网-互联网产品经理改变世界-第二版

2011-11-05

[麻省理工学院-算法导论].Introduction.to.Algorithms,.Second.Edition

[麻省理工学院-算法导论].Introduction.to.Algorithms,.Second.Edition

2011-11-05

电子科大-linux环境高级编程课件

linux 段翰聪 电子科大 高级编程 linux 段翰聪 电子科大 高级编程

2011-10-12

计算机类图书推荐非常全

计算机类图书推荐 非常全 关于编程 数据结构 操作系统 网络等等 都是世界著名教材的推荐

2011-09-27

MLDN魔乐所有javaSE的pdf文档

MLDN魔乐所有javaSE的pdf文档,文档编号是从5开始的,因为前面讲的是Oracle的东西没有上传。 文件目录: 5.Java基础.pdf 6.面向对象基础(1).pdf 7.面向对象基础(2).pdf 8.面向对象基础(3).pdf 9.面向对象高级(1).pdf 10.1.面向对象-高级(2).pdf 10.2.Eclipse.pdf 10.3.及访问控制权限.pdf 10.4.泛型.pdf 10.5.异常的捕获及处理.pdf 11.1.Java常用类库(上).pdf 11.2.多线程.pdf 12.Java常用类库(下).pdf 13.Java IO(上).pdf 14.Java IO(下).pdf 15.Java类集框架.pdf 16.1.Java反射机制.pdf 16.2.枚举.pdf 17.1.Annotation.pdf 17.2.Java数据库编程.pdf 17.3.Java网络编程.pdf 18.JAVA项目案例.pdf

2011-09-26

数据挖掘:概念与技术.pdf

本书全面地讲述数据挖掘领域的重要知识和技术创新。在第1版内容相当全面的基础上,第2版展示了该领域的最新研究成果,例如挖掘流、时序和序列数据以及挖掘时间空间、多媒体、文本和Web数据。本书可作为数据挖掘和知识发现领域的教师、研究人员和开发人员的一本必读书。   本书第1版曾是受读者欢迎的数据挖掘专著,是一本可读性极佳的教材。第2版充实了数据挖掘领域研究新进展的题材,增加了讲述最新的数据挖掘方法的若干章节。本书适合作为高等院校计算机及相关专业高年级本科生的选修课教材,特别适合作为研究生的专业课教材

2011-07-08

电子科技大学复试计算机专业课面试问题锦集答案

电子科技大学复试计算机专业课面试问题锦集答案

2011-07-08

考研数据结构1800题

考研数据结构1800题 研究生统考必看习题

2010-08-02

汇编课程设计大集合(10来个左右)

基本上把网上能找到的都搜集起来了 有的只有源码 有的有实验报告 有的还有课程ppt 方便大家不用到处找了.

2009-12-24

jJava程序员上班那点事儿

Java程序员上班那点事儿 看看也不赖~

2009-12-19

PowerDesigner数据库建模技术

PowerDesigner数据库建模技术 pdf电子书

2009-12-19

java数据结构课程设计(2个选题,内附源码和详细的设计报告)

我自己的java数据结构课程设计 共2个选题 1.利用线程计数比较多种排序算法 2.文本编辑器 内附源码 详细的设计报告 jar文件

2009-12-12

常用8086汇编指令(彩色版)+汇编指令查询器

常用8086汇编指令(彩色版)+汇编指令查询器

2009-12-12

CSS 2.0中文手册(含索引)

CSS 2.0中文手册(含索引) 非常好用 做网页必备的 还带实例

2009-12-05

J2EE+1.3.1+API.chm

JavaTM 2 Platform, Enterprise Edition, v 1.3 API Specification

2009-12-04

程序设计经典问题,经典算法

程序设计的经典问题,如河内之塔,八皇后,巴斯卡三角形等等 非常全面 基本上是你学编程学数据结构必定会遇到的经典问题 word文档 124页 语言采用c语言 学其它高级语言的看没任何问题

2009-11-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除