自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

原创 php爬虫抓取信息及反爬虫相关

58爬虫了百姓,赶集和58互爬,最后各种信息相同,都是爬虫后的数据库调用,潜规则啊,几家独大还暗中各种攻击,赶驴网的幽默事例我不想多评价。这个时代是砸.钱*养.钱的时代,各种姚晨杨幂葛优,各种地铁公车广告,各种卫视广告,铺天盖地~~~来谈php爬虫抓取信息~~php爬虫首推Curl函数了,先来认识下它。0x01.curl扩展的安装:1.确保php子文件夹ext里面有php_

2015-05-30 17:23:56 3024

转载 阿里巴巴、百度前端工程师 2015 暑期实习生面试经历

2015 年 3 月参加并通过了阿里巴巴和百度的前端面试,前后历时三周,最后选择了阿里无线事业部作为暑假实习,但是也很向往 EFE 的 echarts 哦!有机会一定去体验下~ 这篇博客一来为自己作记录,二来希望给需要的人一些经验。如果有觉得我又说着说着吹捧起自己来了,千万别觉得我很骄傲~ 其实是因为我一直都会给自己积极的心理暗示哦!准备工作最初是听实验室的同学开始讨论投这里简历那

2015-05-26 11:05:14 17111

原创 http协议

HTTP是一个属于应用层的面向对象的协议,由于其简捷、快速的方式,适用于分布式超媒体信息系统。它于1990年提出,经过几年的使用与发展,得到不断地完善和扩展。目前在WWW中使用的是HTTP/1.0的第六版,HTTP/1.1的规范化工作正在进行之中,而且HTTP-NG(Next Generation of HTTP)的建议已经提出。HTTP协议的主要特点可概括如下:1.支持客户/服务器模式。

2015-05-26 10:52:18 620

原创 基于情感词典和朴素贝叶斯算法实现中文文本情感分类

最近派给我一个任务,说是要做情感分析的东西,最开始对此也是一点都不了解,经过一段时间的学习,对一个给出的算法做了一下简单的实现。首先,扯一下概念性的东西:人们对事物的情感都是有两面性的,如正面与反面、褒义与贬义等。一般认为,文本的情感倾向分配是一个两分类问题,就是把文本分成正面和负面两类,一般中文情感分类器的构建过程主要包括中文文本处理及表示、特征选择、分类器训练和分类

2015-05-26 10:37:16 13328 6

原创 利用HttpClient模拟登陆人人网、发送状态

由于利用网络爬虫抓取信息,不可避免的会遇到一些需要模拟登陆的地方,听学长讲人人网的登陆相对简单,于是乎便从模拟登陆人人网开始尝试。首先便是从网上搜集资料,看看别人的代码是怎样实现模拟登陆人人的。找到的一篇文章它比较详细的从登录时抓取的数据包进行分析,一步一步的实现模拟登陆。我迫不及待的把他的代码直接粘贴下来,却发现不能像他那样得到正确的结果,于是我便想仿照着他的方法一步一步的分析一下登陆的

2015-05-26 10:35:44 1265

原创 网络爬虫学习笔记(二)

一个简单网络爬虫的实现——抓取网易新闻这次来指定一个信息量稍大一点的抓取目标——网易新闻(国内新闻) http://news.163.com/domestic/这次要达到的目标:1. 提取有用文本信息2. 将新闻中所包含的图片信息保存在本地3. 构建新的HTML文件,其中只包含有新闻主体内容与对应的图片信息

2015-05-26 10:32:28 903

原创 网络爬虫学习笔记(一)

一个简单网络爬虫的实现——初尝试 抓取百度首页       由于分组我选择了网络爬虫组,在了解了一些简单的概念性知识之后,便迫不及待的想要动手尝试一下自己抓取网页信息,在此分享一下自己学习网络爬虫的过程。       首先,什么是网络爬虫? 以下是百度百科的定义       那么,网络爬虫的基本工作原理又是什么?1)从一个初始URL集

2015-05-26 10:32:19 1126

原创 strstr、stristr、strpos这三个函数的区别

strstr -- 返回字符串中从某指定字符开始到结束处的字符串。语法:string strstr ( string haystack, string needle)返回haystack中从needle开始到结束的字符串.如果没有返回值,即没有发现needle,则返回FALSE 注: 这个函数是大小写敏感的。stristr与strstr 的区别就是stristr

2015-05-08 22:35:34 2750

考研方案总结

文档提供相关的考研方案总结,比如数学,英语等

2015-06-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除