- 博客(6)
- 收藏
- 关注
原创 Python学习笔记
绝大多数Linux和Unix系统只要安装完毕Python,Python解释器已经默认存在了,运行python命令启动交互式解释器,要退出可使用快捷键Ctrl+D。1、定义函数>>>def print_lyrics():... print "I am a worker."函数定义的第一行为函数头,其他部分为函数体,函数头以冒号结束,函数体整体缩进一级,缩进总是...
2018-04-19 16:52:52 569
原创 Hive学习笔记
1、几个排序函数区别order by:对查询结果集执行一个全局排序。如果在set hive.mapred.mode=strict模式下使用order by语句,那么必须要在语句中加上limit关键字,因为执行order by的时候只能启动单个reduce,如果排序的结果集过大,那么执行时间会非常漫长。sort by :会在每个reducer中对数据进行排序,也就是执行一个局部排序过程。这可以保...
2018-04-19 16:51:58 559
原创 Hadoop学习笔记
1、Hadoop主要发行版本主流的Hadoo生态圈除了Apache Hadoop外,还有Cloudera、HortonWorks、MapR三个不同版本。1)Cloudera Distribution for Hadoop(CDH)优点:提供了包含大量包括组件和特性的用户友好界面缺点:性能不是很好,速度较慢2)Hortonworks Data Platform(HDP)优点:唯一支持Windows平...
2018-04-19 16:50:59 400
原创 Java正则表达式学习笔记
1.作用正则表达式用于操作字符串数据。通过一些特定的符号来体现,所以学习正则表达式就是要学习这些符号。简化了数据,但阅读性差。2.正则表达式对字符串的常见操作匹配:使用的是String类中的matches方法。切割:使用的是String类中的split方法。(引入组的概念)替换:使用的是String类中的replaceAll方法获取:需要三步。下面是一个从字符串中获取长度为3的单词...
2018-04-19 16:49:30 147
原创 Java基础学习笔记
1. JAVA 中的堆、 栈 和 常量池 :1)寄存器最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制。2)栈存放基本类型的变量数据和对象的引用,但对象本身不存放在栈中,而是存放在堆(new 出来的对象)或者常量池中(字符串常量对象存放在常量池中)。存储的都是局部变量,而且变量所属的作用域一旦结束,该变量就自动释放。3)堆存放所有new出来的对象和成员变量。成员变量存储在堆中的对象里...
2018-04-19 16:48:37 214
原创 linux常用知识总结
1. wc命令用法wc -c 统计字节数 -m 统计字符数 -l 统计行数 -w 统计字数/单词数例1:查询文件中某字符出现的次数:grep 'abc' request.log | wc -lcat request.log | grep ‘abc’ | wc -l例2:查询该文件的行数,单词数,字节数wc testfile2 92 598 testfile例3:查询多个文件的行数,单词数,字节数...
2018-04-19 16:46:18 168
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人