自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 资源 (2)
  • 收藏
  • 关注

原创 指定文件名修改文件名称

import java.io.File;/* * 文件名全部修改*/public class UpdateFileName { public static void main(String[] args) { File root = new File("C:/Users/Documents/军事3"); try { renameFile(root); } catch (Exception...

2018-05-30 10:47:42 5683

原创 部分修改文件名称

import java.io.File;public class ChangeWenJianName {    /**     * @param args     */    public static void main(String[] args) {        // TODO Auto-generated method stub        getFileName();    }   ...

2018-05-30 10:46:32 554

转载 随机修改文件名称

起因:保存的文件太多合并的时候文件名相同会覆盖所有需要一个可以全部重命名的工具。注意: 在修改文件名称的过程中要指定文件存放的位置否则所有文件会归到项目路径下面。package test;import java.io.File;import java.util.UUID;public class UpdateFileName { public static void main(String[] a...

2018-05-30 10:45:13 979

转载 java.io.File类中mkdir()与mkdirs()区别

在Java中对文件进行操作时常常用到java.io.File.mkdir()和java.io.File.mkdirs()两个方法来创建一个目录(文件夹),这两个方法非常相似,都是无参数且返回值都为boolean类型的方法,都是用于创建指定路径名称对应的目录,但二者主要区别如下:java.io.File.mkdir():只能创建一级目录,且父目录必须存在,否则无法成功创建一个目录。java.io.F...

2018-05-30 09:17:31 248

转载 聚类

前面做过一个神经网络的分类器 现在有一些数据需要做聚类处理。 那什么叫做聚类呢 跟分类有什么区别。分类:明确知道类别,然后把数据归类。聚类:你不知道类别,但你想把这些数据分成N类,根据某种算法把数据进行分组,相似或相近的自动归到一组中。(一般用k均值聚类算法)聚类与分类相比较:分类:实例式学习,分类前明确各个类别的信息,并可以直接断言每个元素映射到一个类别;聚类:无监督学习,在聚类前不知道类别甚至...

2018-05-17 22:14:08 713

转载 K-means算法及文本聚类实践

K-Means是常用的聚类算法,与其他聚类算法相比,其时间复杂度低,聚类的效果也还不错,这里简单介绍一下k-means算法,下图是一个手写体数据集聚类的结果。 基本思想 k-means算法需要事先指定簇的个数k,算法开始随机选择k个记录点作为中心点,然后遍历整个数据集的各条记录,将每条记录归到离它最近的中心点所在的簇中,之后以各个簇的记录的均值中心点取代之前的中心点,然后不断迭代,直到收敛,算法描...

2018-05-17 21:58:48 1164

转载 基于 K-Means 算法的文本聚类

K-Means 算法的文本聚类阅读数:7571、 能够从社交媒体或网上给定的数据集(数据集已给定),从中挖掘出新闻话题,如在线检测微博消息中大量突现的关键字,并将它们进行聚类,从而找到若干个新闻话题。 2、 给定一个新闻信息或报道作为测试样本,测试其所属的报道分类。 3、 最终要求有训练集,测试集,聚类模型和相关源码及简要说明。 4、 系统实现包含预处理,特征提取,训练时采用的聚类模型,测试时采用...

2018-05-17 21:49:43 2403 1

转载 文本聚类总结

016年09月28日 09:23:45阅读数:9414摘要:文本聚类是搜索引擎和语义web的基本技术,这次本蛙和大家一起学习一下简单的文本聚类算法,可能不能直接用于实际应用中,但对于想学搜索技术的初学者还是有一定入门作用的。这里会用到TF/IDF权重,用余弦夹角计算文本相似度,用方差计算两个数据间欧式距离,用k-means进行数据聚类等数学和统计知识。关于这些概念可以去google,或者参考文本后...

2018-05-17 21:43:51 1369

转载 十大经典排序算法(动图演示)

十大经典排序算法(动图演示)0、算法概述0.1 算法分类十种常见排序算法可以分为两大类:非线性时间比较类排序:通过比较来决定元素间的相对次序,由于其时间复杂度不能突破O(nlogn),因此称为非线性时间比较类排序。线性时间非比较类排序:不通过比较来决定元素间的相对次序,它可以突破基于比较排序的时间下界,以线性时间运行,因此称为线性时间非比较类排序。 0.2 算法复杂度0.3 相关概念稳定:如果a原...

2018-05-17 17:22:33 162

转载 K-means聚类算法初探

数据聚类是对于静态数据分析的一门技术,在许多领域内都被广泛地应用,包括机器学习、数据挖掘、模式识别、图像分析、信息检索以及生物信息等。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集,这样让在同一个子集中的成员对象都有相似的一些属性,常见的包括在坐标系中更加短的空间距离等。我们拿2维特征的实例作为例子。我们以这个2维特征向量作为坐标,在一个2维空间中用点标注出这些实例,如图1所示,...

2018-05-16 20:43:22 470

转载 朴素贝叶斯的优缺点

朴素贝叶斯的主要优点有:1)朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率。2)对小规模的数据表现很好,能个处理多分类任务,适合增量式训练,尤其是数据量超出内存时,我们可以一批批的去增量训练。3)对缺失数据不太敏感,算法也比较简单,常用于文本分类。朴素贝叶斯的主要缺点有:1) 理论上,朴素贝叶斯模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为朴素贝叶斯模型假设属性之间相...

2018-05-14 16:34:08 27384 1

转载 JAVA字符串转日期或日期转字符串

文章中,用的API是SimpleDateFormat,它是属于java.text.SimpleDateFormat,所以请记得import进 来!         用法: SimpleDateFormat sdf =   new SimpleDateFormat( " yyyy-MM-dd HH:mm:ss " );         这一行最重要,它确立了转换的格式,yyyy是完整的公元年,MM是...

2018-05-13 14:32:22 3000

转载 hashCode与equals的作用与区别及应当注意的细节

最近去面试了几家公司,被问到hashCode的作用,虽然回答出来了,但是自己还是对hashCode和equals的作用一知半解的,所以决定把它们研究一下。以前写程序一直没有注意hashCode的作用,一般都是覆盖了equals,缺没有覆盖hashCode,现在发现这是埋下了很多潜在的Bug!今天就来说一说hashCode和equals的作用。       先来试想一个场景,如果你想查找一个集合中是...

2018-05-12 17:28:59 144

转载 java中==与equel的区别

值类型是存储在内存中的堆栈(以后简称栈),而引用类型的变量在栈中仅仅是存储引用类型变量的地址,而其本身则存储在堆中。    ==操作比较的是两个变量的值是否相等,对于引用型变量表示的是两个变量在堆中存储的地址是否相同,即栈中的内容是否相同。    equals操作表示的两个变量是否是对同一个对象的引用,即堆中的内容是否相同。    ==比较的是2个对象的地址,而equals比较的是2个对象的内容。...

2018-05-10 21:00:21 166

原创 Exception in thread "main" java.io.FileNotFoundException: File does not exist: hdfs://master:8020/us

Exception in thread "main" java.io.FileNotFoundException: File does not exist: hdfs://master:8020/user/seletedata/part-r-0000 at org.apache.hadoop.hdfs.DistributedFileSystem$18.doCall(DistributedFileS...

2018-05-03 17:03:31 3108

转载 Java实现远程HDFS的文件操作(新建、上传、下载、删除)

HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础篇,为了实现本地与HDFS的文件传输,主要借助Eclipse开发环境,通过java编程实现了远程HDFS的文件创建,上传,下载,删除等。   其实对HDSF的文件操作主要有两种方式:命令行的方式和JavaAPI的方式。命令行的方式简单直接,但是必须要求本地机器也是...

2018-05-03 16:28:51 1123

原创 hdfs在Eclipse里使用代码修改编辑文本等权限问题

hdfs-site.xml中的配置没有下面代码(本人的问题)开放权限        dfs.permissions      false      之后重新启动服务器节点

2018-05-02 17:16:28 270

转载 log4j:WARN No appenders could be found for logger 解决方案

log4j:WARN No appenders could be found for logger 解决方案(转载地址)我们在使用Log4j的时候,总是出现: Java代码  log4j:WARN No appenders could be found for logger (org.apache.ibatis.logging.LogFactory).  log4j:WARN Please ini...

2018-05-01 16:28:17 2509

原创 Exception in thread "main" org.apache.hadoop.security.AccessControlException: Permission denied: use

Exception in thread "main" org.apache.hadoop.security.AccessControlException: Permission denied: user=zhuy, access=WRITE, inode="/user":root:supergroup:drwxr-xr-xat org.apache.hadoop.hdfs.server.nam

2018-05-01 16:07:43 5326 1

十六进制转换为其它进制

十六进制转换为其它进制

2017-05-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除