自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 [Java][机器学习]决策树算法

在之前为了处理Iris花的分类算法,写了一个决策树算法,但这个算法局限性比较大,只能用于那一种情况,所以为了增强代码的复用性,在之前的基础上修改了算法,增强了复用性。略有遗憾的是,由于很多模块,比如快速排序,是为了处理Iris花专门写的,所以现在要进行一些转换才行,一定程度上增加了代码的复杂度和冗余度。这个是以后值得注意的地方,即在设计之初就应该注意到代码的复用问题,尽可能早的定义好通用接口

2015-03-30 12:13:11 2565

原创 [Java][机器学习]用决策树分类算法对Iris花数据集进行处理

Iris Data Set是很经典的一个数据集,在很多地方都能看到,一般用于教学分类算法。这个数据集在UCI Machine Learning Repository里可以找到(还是下载量排第一的数据哟)。这个数据集里面,每个数据都包含4个值(sepal length,sepan width,petal length,petal width)以及其种类。而分类算法的目标,就是根据4个值来把花的种类确定

2015-03-25 20:16:04 5504 1

原创 [Java]快速排序算法的Java实现

最近想学点分类算法,在写决策树算法的时候对于连续变量要先进行排序,于是就先写了一个快排的算法。思路照着百度百科上的C语言版本学的,但是由于java中没有指令的存在,所以必须要在一些方面做些变通,修改了异常处理模块,并增加了一个合并两个字符串的函数。public class QuickSort{ /** * 快速排序 * @author Multiangle from S

2015-03-21 15:08:53 945

原创 Spider for UCI Machine Learning Repository

原谅我用英文标题。。。因为我觉得用英文来表示更贴切一些。。这个爬虫用于搜集UCI的机器学习知识库的一些背景资料和下载链接。主要是对jsoup包的运用,然后用jxl包把资料写入到excel里面。 每个数据集都有下列信息: Name,AssociatedTasks,AttributeCharacteristics,NumberOfInstances, NumberOfAttributes,Data

2015-03-06 10:16:43 1655

原创 百度贴吧爬虫 v1.0

之前想写一个爬虫,但是网上简单的教程几乎没有能运行的,不是缺关键函数就是其他的因素。无奈之下只能自己动手,之前还学了HttpURLConnection包的使用,但是用了html解析器Jsoup以后发现它自带了获取html代码的功能,因此这个爬虫就是主要围绕Jsoup来写了,还有一些正则表达式的运用来负责修剪。 主要功能是对一个帖子里楼主的所有发言进行归纳,统一保存在一个txt里面。 废话不多

2015-03-03 12:10:03 962

转载 使用jxl.jar来进行excel操作

jxl是一个韩国人写的java操作excel的工具, 在开源世界中,有两套比较有影响的API可供使用,一个是POI,一个是jExcelAPI。其中功能相对POI比较弱一点。但jExcelAPI对中文支持非常好,API是纯Java的, 并不依赖Windows系统,即使运行在Linux下,它同样能够正确的处理Excel文件。 另外需要说明的是,这套API对图形和图表的支持很有限,而且仅仅识别PNG格式。

2015-03-03 11:51:13 1476

转载 URL,URLConnection,HttPURLConnection的使用

URLConnection与HttPURLConnection都是抽象类,无法直接实例化对象。其对象主要通过URL的openconnection方法获得。值得注意的是:1.openConnection方法只创建URLConnection或者HttPURLConnection实例,但是并不进行真正的连接操作。并且,每次openConnection都将创建一个新的实例。2.openConnection不

2015-03-03 11:31:40 1065

转载 通过java获取html网页代码

最近这段时间想学爬虫来自己获取数据,因此找了几篇简单的java爬虫教程博客来看。令人失望的是这些爬虫基本都用不了。而复杂的爬虫又不适合初学者。由于我只是想做一个类似于脚本的东西,因此想了想,还是自己动手吧。先从获取html网页代码入手。import java.io.BufferedReader; import java.io.InputStreamReader; import java.ne

2015-03-03 11:29:18 4476

原创 用Java控制SQL进行一些简单的处理(改进版)

针对之前存在的问题,现在做出了改进。对于2个经常要查询的表,制定了propertyblock类和propertycontrol类,propertyblock类里3个数组,分别存放名字,id和活跃度。propertycontrol里则有一个37*37的二维数组,共1369个propertyblock类作为入口(为什么是37*37呢,26个字母+10个数字+其他字符)为了加快查找速度,每次得到一个新的名

2015-03-03 11:27:22 1781

原创 用Java控制SQL进行一些简单的处理

之前已经实现了SQL SERVER的配置,也能够用Java与SQL连接了。那么,现在要做的就是小试牛刀了!我要做的是处理一个关于豆瓣书评的数据集。原来导入的只有书名,用户名和评分。我现在要做的就是建立一个新表,里面包括行id,书的id,书名,用户Id,用户名和评分。主要问题是建立一个用户表和书表。当原表输入一个新行时,检测书名是否在书表里面出现过,出现过的话就用现成的书id,否则就把这个书名插入书表

2015-03-03 10:57:34 763

转载 Java连接Sql Server的过程及遇到的问题(极端新手向)

在安装完SQL Server 2008以后,接下来要做的就是用Java实现与SQL的连接。一开始在网上找了篇文章,是用 com.sun.rowset.CachedRowSetImpl 这个类来实现的。这个类虽然在oracle上可以找到API,但是死活找不到下载的地方,而我eclipse里面又没有,花了好几天还是不行,后来换了种方法,是用JDBC来实现的。首先需要做的是下载微软的JDBC_DRIVER

2015-03-03 10:45:36 1171

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除