- 博客(4)
- 收藏
- 关注
原创 使用HttpClient实现网络爬虫 1
近期,听大神讲了一些分词的算法,深受启发,打算做一个互联网热词发现系统,主要由一个分布式网络爬虫和一个分词系统再加一个数据库构成,数据库这块还没有什么头绪,但是网络爬虫和分词算法都有些许眉目。于是打算将网络爬虫从最简单的抓取单个页面到宽度优先遍历再到多线程爬虫最后到分布式网络爬虫一一写到博客。其中会夹杂一些页面内容提取之类。 这是第一篇,先介绍爬取单个网页。1.什么是HttpClie
2016-09-22 09:19:25 1106
原创 K-means聚类
1.聚类与分类的区别分类是按照样本的某种属性标记来对样本进行区分,归类;而聚类是对无标记样本进行的操作。聚类通过发掘无标记样本的内在规律从而对样本进行分类。因此聚类是“无监督学习”算法的一种典型代表。2.k-means聚类算法当我们获得了给定的样本集 D={x1,x2,x3......xn}时,k-means算法对于样本得到一个簇的集合 C = {C1,C2,C3....}。 簇的集合
2016-09-16 16:51:56 505
原创 初学安卓:安卓小游戏之2048
前一段时间开始学习安卓开发时,写了一个小游戏 2048因为顺便学习了一下界面跳转,所以在主界面即游戏界面前还有一个界面作为欢迎界面。主界面代码如下:import android.app.Activity;import android.content.Intent;import android.graphics.Bitmap;import android.graphics.Bitm
2016-03-02 21:38:17 1385
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人