- 博客(21)
- 资源 (22)
- 收藏
- 关注
原创 数据清洗小结
一1、对于快速排序 public static void QsortplusB(String[] arr, int low, int high) { if (low >= high) return; int lt = low; int gt = high; String temp = arr[low]; int i = low + 1; while (i <
2016-12-31 16:12:48 2103 2
原创 目录遍历
1、遍历文件夹 String path="C:\\Users\\haha"; File dirlist=new File(path); if(dirlist.isDirectory())//如果是文件夹(目录) { File[] fs1=dirlist.listFiles();//遍历当前文件夹(返回的是一个数组)
2016-12-30 10:42:56 370
原创 byte数组与int数组相互转化
1、int数组转化为byte数组0x 16进制 0b二进制 2、任何数和1作与值不变 :0&1=0 1&1=1 任何数和0作与清0:1&0=0 0&0=0 public static byte [] itob(int [] intarr) { int bytelength=intarr.length*4;//长度
2016-12-26 00:55:56 9245
原创 索引排序文件--不排序数据排序索引暨介绍大数据常用的显示数据的两种方式
本文讲述近期大数据处理的心得:以索引排序文件--不排序数据排序索引 为例剖析大数据常用的显示数据的两种方式应用一:根据键盘输入的行数,打印文件对应的行数数据以及后几行数据已知:CSDNdataSortindexlast不排序数据的排序索引文件--索引排序文件CSDN数据原文件CSDNdataSort为格式化并排序文件目标详述--根据输入的行数,获得查询类似已经排
2016-12-25 22:17:16 688
原创 字符串中用正则表达式邮箱
1、邮箱判断并提取 @Test public void test() { String line[] = new String[] { "04-|--|-jmyuncker@aol.com-|-r4Vp5iL2VbM=-|-maiden name|--", "06-|--|-fernandograciliano@hotmail.com-|-Cm8mAzxAiwzioxG
2016-12-22 10:23:36 1408
原创 递归调用、栈、斐波那契数列
1、递归调用实现1+2+3+...+100 public static int getNum(int num) { if(num==1) { return 1; } else { return get100(num-1)+num; }
2016-12-19 17:37:47 1094
原创 快速排序优化
解决数据大量重复的问题,提高排序效率 public static void show(int[] args) { for(int i=0;i<args.length;i++) { System.out.print(args[i]+" "); } System.out.prin
2016-12-18 16:20:36 297
原创 堆排序
原理:左右节点 大的给父节点,登顶后与相对i最后一个位置的数值进行交换1、堆排序实现由大到小排序 public static void swap(int[] data,int i,int j) { int temp=data[i]; data[i] =data[j]; data[j]=temp; }
2016-12-18 15:53:18 281
原创 冒泡排序
1、对数字进行排序 public static void sortNum(int [] ints){ String[] strs=new String[]{"abc","cba","bcd","zxu","avb"}; for(int i=1;i<ints.length;i++) { for(int
2016-12-14 19:36:03 276
原创 基于大文本文件的文本读取查找
一、1、本地磁盘读取大文件(可能是本地记事本打不开的文本文件),并获取需要的某个数据,显示一共有多少条数据----大数据文本浏览器 public static int getLine() throws FileNotFoundException, IOException { //获得行数 int lin
2016-12-12 22:17:25 3338
原创 二分查找与拉格朗日差值查询
一、我们先写一个主方法:二分查找时间复杂度假使总共有n个元素,那么二分后每次查找的区间大小就是n,n/2,n/4,…,n/2^k(接下来操作元素的剩余个数),其中k就是循环的次数。最坏的情况是K次二分之后,每个区间的大小为1,找到想要的元素令n/2^k=1,可得k=log2n,(是以2为底,n的对数),所以时间复杂度可以表示O()=O(logn). public st...
2016-12-12 21:16:03 597
原创 快速排序
package quicksort;public class QuickSort { public static void main(String[] args) { int [] myint=new int[]{4,1,9,2,8,7,3,13,113,12}; show (myint); //输出排序前结果 Qsort(myi
2016-12-12 20:03:37 331
原创 kettle连接mysql异常处理
kettle连接mysql数据库时,抛出异常:Communications link failure The last packet sent successfully to the server,The last packet sent successfully to the server was 0 milliseconds ago. The driver has not received
2016-12-06 12:02:42 1937 2
原创 sqoop工作
sqoop可以把MySQL、Oracle等数据库的数据导入到HDFS,也可以把HDFS的数据导入到数据库。1、导出mysql的数据到HDFSmysql端创建数据库sqoop的表test,并制造数据su root cd /usr/local/mysql/bin mysql -u root -p mysql>create database sqoop;
2016-12-06 01:51:49 404
原创 修改网卡IP
1、cd /etc/sysconfig/network-scriptscat ifcfg-eno16777736vi ifcfg-eno16777736 //修改ip地址service network restart //重启网卡服务2、cat /etc/hostsvi /etc/hosts //修改ip地址对于oracle操作可能还需要重新创建监听-监听可
2016-12-05 12:10:46 1029
转载 一头大象--Hadoop生态圈
一、简介 Hadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。简单地说来,Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。图1 Hadoop主要项目 Common:一组分布式文件系统和通用I/O的组件与接口(序列化、Java RPC和
2016-12-04 01:10:54 1457
转载 HIVE与mysql的关系 hive常用命令整理 hive与hdfs整合过程
一、HIVE与mysql的关系 Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。Hive是Facebook 2008年8月刚开源的一个数据仓库框架,其系统目标与 Pig 有相似之处,但它有一些Pig目前还不支持的
2016-12-04 00:17:24 7250
转载 Oracle SQL 基本操作之 用户权限管理方法
最近把有关用户操作和权限管理的东西整理了一下,虽然不少博客都有过类似的整理,但是自己发现他们的内容或多或少都有些错误。于是,本人亲自对每条语句进行验证后,并对其做了自己的讲解和分析,撰写本篇博客。或仍有错误之处,望各位指出,谢谢! 闲话少说,开始进入正题!一、系统用户sys;//系统管理员,拥有最高权限 system;//本地管理员,次高权限 scott;//普通用户,密码默认
2016-12-03 22:18:40 527
原创 安装oracle客户端若干心得
1、把各种软件及oracle服务器端装于虚拟机中,苦于各种虚拟机内部IP与本地IP(VMnet8)不同往往需要相互之间作修改,无论修改任何一方都很很麻烦,现介绍一种简单的方法。每次把一份虚拟机准备好了之后:直接于编辑--》虚拟网络编辑器 中直接修改VMnet8的地址与虚拟机内部iIP【本地IP(VMnet8)】同意网段,这样就能一步到位,不用每次都修改本地IP(VMnet8)或者修改虚拟机内部IP
2016-12-03 20:39:05 341
转载 电影,趁心情不美丽
无法触碰永不放弃我是大卫跳出我天地 http://movie.douban.com/subject/1301169/绿里奇迹 闪电奇迹 http://movie.douban.com/subject/1300549/我是山姆超时空接触 http://movie.douban.com/subject/1295647/深渊天伦之旅巴尼的人生想飞的
2016-12-03 16:32:25 1224
Algorithm negotiation fail
2017-09-06
开发hadoop配置
2017-02-16
IO集合增强for循环练习
2016-09-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人