- 博客(12)
- 资源 (15)
- 收藏
- 关注
原创 分类算法-KNN
KNN相关概念及流程概念邻近算法,常见数据挖掘分类算法中最简单的方法之一。所谓K近邻,即K个距离最近的邻居,说的是每个样板都可以用它最近的K个邻居来代表。```## 类型是一种分类算法,基于实例的学习(instance-based learning)。 数据集实现已有分类和特征值,待收到新样本后直接进行处理,与急切学习(eager learning)相对应## 特点- 惰性学习(...
2020-02-28 00:14:42 476
原创 设计模式简述
设计模式分类创建性模型:对对象创建过程的各种问题和解决方法的总结工厂模式(Factory,Abstract Factory),单例模式(singleton),构建器模式(Buider),原型模式(Pototype)结构型模式:是对软件设计结构的总结,关注与类、对象继承、组合方式的实践经验桥接模式(Bridge),适配器模式(Adapter),装饰器模式(Decorator),代...
2020-02-26 13:27:01 146
原创 接口和抽象类区别
二者区别1.接口和抽象类时Java面向对象设计的基础机制2.接口是行为的抽象,抽象方法的集合,子类可以多重实现,利用接口达到API定义和实现分离目的。不能实例化,不包括任何非常量成员,任何field都隐含public static final意义同时,非静态方法实现,也就是抽象方法,或静态方法,如Java标准库中的List接口3.抽象类,用abstract关键字修饰class,只能被单...
2020-02-26 12:56:34 141
原创 常见Java文件拷贝方式及效率
#方法一利用Java.IO,设置缓冲区,通过字节输入流从源文件中将数据读入缓冲区,然后再用字节输出流输出到目标文件中。public static void copyFileByChannel(File source, File dest) throws IOException { try (FileChannel sourceChannel = new FileInputStre...
2020-02-25 23:40:08 959
原创 Java内存模型
JVM 内存模型方法区1.共享,存放类元数据信息,类静态变量,常量,运行时常量池2.生命周期:在JVM启动时创建,在JVM停止时销毁3.版本:jdk8以后是MetSpace堆1.共享,存放引用数据类型,数组,集合,类实例2.生命周期:在JVM启动时创建,在JVM停止时销毁3.参数设置 -Xms:初始堆内存大小,-Xmx:最大堆内存大小Java虚拟机栈1.线程私有,执行Jav...
2020-02-25 21:50:52 111
原创 Java IO,NIO多路复用
简述IO1.首先,传统java.io包,基于流模型实现,提供常见功能,File抽象,输入输出流等。交互方式是同步、阻塞的方式,即读取输入流或写入输出流时,在读、写动作完成之前,线程会一直阻塞,他们之间的调用时可靠的线性顺序。2.java.io包的好处是代码比较简单、直观,缺点是IO效率和扩展性存在局限性,容易成为性能瓶颈3.很多时候,java.net下面提供的部分网络API,比如Socke...
2020-02-25 13:23:47 225
原创 ConcurrentHashMap如何实现高效线程
Java集合线程安全机制Java提供了不同层面的线程安全支持。在传统集合框架内部,除了HashTable等同步容器,还提供了所谓的同步包装器(synchronized Wrapper),可以通过调用Collection工具类的包装方法,来获取同步包装器(Collection.synchronizeList,Collection.synchronizeMap等),但是它们都是利用非常粗粒度的同步...
2020-02-25 10:36:17 410
原创 spark shuffle算子
MapReduce基于MapReduce编程思想的spark运行程序,仍然是以先运行map端程序,将map程序处理的结果溢写到磁盘,然后执行reduce端程序进行shuffle操作,对map端处理结果进行处理,得到最终结果。spark driver端将程序创建成job后,通过DAGSchduler将其转换为DAG,然后根据shuffle算子,将其切分为多个stage,stage保证多个任务,形...
2020-02-24 23:12:40 1226
原创 HashTable,HashMap,TreeMap
共性和差异共性都是最常见Map实现,以键值对形式存储、操作数据的容器类型HashTable是最早期Java提供一个hash表实现,本身是同步的,线程安全,不支持null键、值,同步导致性能开销,很少推荐使用HashMap应用更加广泛的hash表实现,行为与HashTable一致,主要区别于HashMap不支持同步,支持null键值,HashMap进行put、get操作,...
2020-02-23 23:25:21 141
原创 Vector、ArrayList、LinkedList
区别都是实现集合框架中的list,即所谓有序集合,具体功能近似,都按照位置进行定位、添加、删除元素,都提供迭代器以遍历其内容等。Vector是Java早期提供线程安全的动态数组,如不需线程安全,不建议选择,毕竟不同有额外开销。Vector内部使用对象数组来保存数据,可以根据需要自动增加容量当数量已满,会创建新的数组,并拷贝原有数组数据ArrayList是应用更广泛的动态数组,非线程安全,...
2020-02-23 20:49:37 99
原创 Java之 int与Integer
区别int是java的8个基本数据类型(byte 1字节,short 2字节,int 4字节,long 8字节,float,double,boolean)之一。Integer是int对象的包装类,有一个int类型的字段存储数据,并且提供了基本操作,如数学运算、int和字符串直接的转换。java5 引入boxing/unboxing,java可以根据上下文进行自动转换,极大简化编程。Int...
2020-02-22 23:17:58 209
原创 Java之String,StringBuffer,StringBuilder比较
三者区别String:java 非常基础和重要的类提供构造、管理字符串各种基本逻辑。典型immutable类,被声明为final class,属性也是final,无法进行基础扩展由于不可变性,类似拼接、裁剪字段,都会产生新的string对象,由于字符串操作普遍性,相关操作效率往往对应用新年有显著影响。StringBuffer:线程安全条件下解决字符串拼接、裁剪效率为解决上面字符...
2020-02-19 22:24:02 144
Flume 根据字段进行路由插入 ES
2019-04-26
验证码工程源码
2016-11-02
JDBC连接Oralce数据库驱动
2014-03-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人