自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 使用HttpClient实现网络爬虫 1

近期,听大神讲了一些分词的算法,深受启发,打算做一个互联网热词发现系统,主要由一个分布式网络爬虫和一个分词系统再加一个数据库构成,数据库这块还没有什么头绪,但是网络爬虫和分词算法都有些许眉目。于是打算将网络爬虫从最简单的抓取单个页面到宽度优先遍历再到多线程爬虫最后到分布式网络爬虫一一写到博客。其中会夹杂一些页面内容提取之类。    这是第一篇,先介绍爬取单个网页。1.什么是HttpClie

2016-09-22 09:19:25 1106

原创 K-means聚类

1.聚类与分类的区别分类是按照样本的某种属性标记来对样本进行区分,归类;而聚类是对无标记样本进行的操作。聚类通过发掘无标记样本的内在规律从而对样本进行分类。因此聚类是“无监督学习”算法的一种典型代表。2.k-means聚类算法当我们获得了给定的样本集 D={x1,x2,x3......xn}时,k-means算法对于样本得到一个簇的集合 C = {C1,C2,C3....}。 簇的集合

2016-09-16 16:51:56 505

原创 初学安卓:安卓小游戏之2048

前一段时间开始学习安卓开发时,写了一个小游戏 2048因为顺便学习了一下界面跳转,所以在主界面即游戏界面前还有一个界面作为欢迎界面。主界面代码如下:import android.app.Activity;import android.content.Intent;import android.graphics.Bitmap;import android.graphics.Bitm

2016-03-02 21:38:17 1385

原创 统计一亿个IP中每个出现的次数

使用JAVA语言统计一亿个IP中每个出现的次数,用HashMap分类

2016-03-02 21:27:50 3865

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除