自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

邦涛的博客

持续关注大数据,Web开发,喜爱Java,Ruby,Python,JavaScript!

  • 博客(12)
  • 收藏
  • 关注

原创 资源整理

嵌入式Linux之我行:http://blog.chinaunix.net/uid/22174347/cid-79951-list-1.html

2016-03-23 20:35:06 316

原创 【Java核心技术】到底什么是JavaBean?

作者:周邦涛(Timen)Email:zhoubangtao@gmail.com转载请注明出处:  http://blog.csdn.net/zhoubangtao/article/details/27102443

2014-05-27 15:54:49 2426

原创 Hadoop 查看SequenceFile

从HDFS上将sequencefile下载到本地后无法查看。其实hadoop命令式支持操作本地文件系统的。查看本地sequencefile文件的方法如下:hadoop fs -Dfs.default.name=file:/// -text sequence文件本地路径HDFS 上直接用-text看即可hadoop fs -text sequence文件HDFS路径

2016-12-12 14:03:16 3162

原创 Markdown 示例

欢迎使用本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl + Q插入链接 Ct

2016-12-08 14:28:28 452

原创 Hive 数据抽样

Hive 抽样语法桶抽样块抽样随机抽样分类随机抽样快捷键Markdown及扩展表格定义列表代码块脚注目录数学公式UML 图离线写博客浏览器兼容Hive 抽样语法Hive使用TABLESAMPLE语法对表进行抽样桶抽样桶抽样语法:tablesample (bucket x out of y [on colname]) tablesample可以用在任何表上,不单

2016-12-08 14:21:41 2011

转载 关于Python的编码、乱码以及Unicode的一些研究

最近接触Python比较多,尤其是在命令行(Terminal)下进行的局部代码测试有很多。而个人编写的代码通常是以UTF-8格式存储的,这在Linux下的Terminal上还好一些(它的编码默认的就是中文UTF-8),要想打印包含中文字符的变量值,基本不会出现乱码情况。但如果是在Windowss下的cmd上进行测试,则相对就要痛苦一些,因为Windows中文环境下cmd的默认编码是GBK。

2016-12-07 13:38:54 10483 1

转载 说说“猴子补丁”

猴子补丁的由来首先说个我自己的笑话,话说Python算是我接触的稍微深点儿的第一门动态语言,用Python没多久就知道了有个Gevent,学习Gevent没多久就知道有个“猴子补丁”的概念。最开始觉得这么名字挺乐呵,猴子补丁,为啥叫这么个名儿?是因为猴子的动作迅速灵敏,Gevent也有这个特点,所以叫猴子补丁么?然后这几天在看《松本行弘的程序世界》这本书,里面专门有一章讲了猴子补丁

2016-12-07 11:25:14 1178

原创 Python 2.6.6的坑

Python 2.6.6是大多数操作系统自带的默认Python版本,下面总结一下:1、str和unicode首先明确,Python2.x里的str实际上是bytearray,另外str->unicode是解码(decode),unicode->str是编码(encode),所以理论上你对unicode类型只能调用encode方法,而对str类型只能调用decode方法,但是不管是uni

2016-04-15 15:22:09 1865

转载 python 字符编码与解码——unicode、str和中文:UnicodeDecodeError: 'ascii' codec can't decode

在进行python脚本的编写时,如果我们用python来处理网页数据或者进行与中文字符有关的处理工作,经常出现这样的出错信息:SyntaxError: Non-ASCII character '\xe6' in file ./filename.py on line 3, but no encoding declared。本文主要讲解python中与unicode和中文、特殊字符编码有关的问题。字符编码和解码需要遵循什么规律?

2016-04-15 12:10:45 778

原创 那些比较变态的Hive需求

那些比较变态的需要Hive实现的需求

2015-10-27 20:03:11 833

原创 Hive复杂查询时,多层union可以转换为left join,左侧临时维度表生成方式

在使用Hive做复杂查询时,通常多个字段来自于不同的表,从而可能产生复杂的多层union all嵌套才能解决,但是Hive不允许Union all,所以需要采用LEFT JOIN来代替,这样就需要在左边生成一个临时维度表,这个维度表的生成方式如文

2015-10-20 11:14:37 2707

原创 Spark学习资源(不断更新)

1、Spark设计与实现:https://github.com/JerryLead/SparkInternals/tree/master/markdown

2015-08-31 11:32:20 465

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除