自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (11)
  • 收藏
  • 关注

原创 刷博客浏览量

看了一篇博客后,感觉很好玩,那直接运行代码了,因为这个代码是python比较老的版本了,所以直接复制运行有点错误,只要稍加修改即可运行# -*- coding: utf-8 -*-"""Created on Sat Sep 30 10:57:20 2017@author: hechengjian"""# -*- coding:utf-8 -*- import urllib

2017-09-30 11:33:21 15572 5

转载 python语法详解

【文件首部/编码声明】    #!/usr/bin/env python    # -*- coding:utf-8 -*-    # 声明脚本使用 utf-8 编码是为了在脚本中含有中文时也能被正确解释运行【注释】    # here we can put a comment, 在井号后添加注释。【缩进/大小写】    必须使用 4 个空格进行缩进。pytho

2017-09-30 10:18:38 3137

转载 HIVE中get_json_object与json_tuple使用

hive中提供了两种针对json数据格式解析的函数,即get_json_object(…)与json_tuple(…),理论不多说,直接上效果示意图:假设存在如下json数据对象,若使用hive环境可这么设置:set hivevar:msg={"message":"2015/12/08 09:14:4", "client": "10.108.24.253", "server":

2017-09-29 15:44:11 7391

转载 Hadoop Streaming

Hadoop Streaming 是Hadoop提供的一个编程工具,Streamining框架允许任何可执行文件或者脚本文件作为Mapper和Reducer在Hadoop MapReduce中使用,方便已有程序向Hadoop平台移植。因此可以说对于hadoop的扩展性意义重大。Streamining的原理:mapper和reducer会从标准输入中读取数据,一行一行处理后发送给标准输出,S

2017-09-29 15:34:42 799

转载 python相关函数

python strip() 函数和 split() 函数的详解及实例一直以来都分不清楚strip和split的功能,实际上strip是删除的意思;而split则是分割的意思。因此也表示了这两个功能是完全不一样的,strip可以删除字符串的某些字符,而split则是根据规定的字符将字符串进行分割。下面就详细说一下这两个功能,1 Python strip()函数 介绍函数原型

2017-09-27 15:40:48 1309 1

转载 hadoop 代码中获取文件名

在hadoop的MR相关代码中,经常需要获得mapper输入的文件名,从而针对不同的文件进行不同的操作。下面简单地介绍一下如果在MR代码中获取文件名1.在streaming中获取文件名实际中经常用python开发streaming程序,在python代码中可以用如下方式获得文件名:import osfilepath = os.environ["mapreduce_map_i

2017-09-27 14:21:58 1279

转载 Python 字符串操作(string替换、删除、截取、复制、连接、比较、查找、包含、大小写转换、分割等)

去空格及特殊符号s.strip().lstrip().rstrip(',')复制字符串#strcpy(sStr1,sStr2)sStr1 = 'strcpy'sStr2 = sStr1sStr1 = 'strcpy2'print sStr2连接字符串#strcat(sStr1,sStr2)sStr1 = 'strcat'sStr2 = '

2017-09-27 13:42:25 192

转载 scala与java之间的关系

FROM: http://www.cnblogs.com/vikings-blog/p/3942417.html scala与java之间的关系,我认为可以用一句话来开头:scala来源于java,但又高于java。  scala的设计者Martin Odersky就是一个JAVA控,这位牛人设计了javac和编写了jdk中的通用代码。可以说java语言本身就是Martin Ode

2017-09-26 16:05:30 11416

转载 Hadoop Streaming框架使用

Streaming简介 Streaming框架允许任何程序语言实现的程序在Hadoop MapReduce中使用,方便已有程序向Hadoop平台移植。因此可以说对于hadoop的扩展性意义重大,今天简单说一下。Streaming的原理是用Java实现一个包装用户程序的MapReduce程序,该程序负责调用MapReduce Java接口获取key/value对输入,创建一个

2017-09-26 13:54:43 340

转载 linux shell编程多线程和wait命令学习

http://blog.csdn.net/shuanghujushi/article/details/38186303最近在使用shell做一些部署工作,在使用过程中,效率一直不高。想提高效率,经过分析发现,并不是所有操作都是需要串行的,一些操作是可以进行并行操作的。经过学习,shell里面也是可以进行多线程编程的,而且十分方便,同时,wait命令可以进行shell的多线程同步控制。下面是sh

2017-09-26 12:17:38 242

转载 shell调试

[以下字段转自:http://linux.chinaitlab.com/SHELL/727128_4.html]"-x"选项可用来跟踪脚本的执行,是调试shell脚本的强有力工具。“-x”选项使shell在执行脚本的过程中把它实际执行的每一个命令行显示出来,并且在行首显示一个"+"号。 "+"号后面显示的是经过了变量替换之后的命令行的内容,有助于分析实际执行的是什么命令。 “-x”选项使用起来

2017-09-26 11:36:52 237

转载 org.apache.hadoop.hive.serde2.SerDeException: Row is not a valid JSON Object

重要的是每行必须是一个完整的JSON,一个JSON不能跨越多行,也就是说,serde不会对多行的Json有效。 因为这是由Hadoop处理文件的工作方式决定,文件必须是可拆分的,例如,Hadoop将在行尾分割文本文件。// this will work{ "key" : 10 }// this will not work{ "key" : 10 }2. 下载Jar

2017-09-15 17:36:53 2736

转载 优化hive

下面给你建议:使用过程中该如何优化hive:一、    控制hive任务中的map数: 1.    通常情况下,作业会通过input的目录产生一个或者多个map任务。 主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到,该参数不能自定义修改);2. 

2017-09-14 17:06:45 192

转载 scala相关知识

Scala中的下划线到底有多少种应用场景?1、作为“通配符”,类似Java中的*。如import scala.math._2、:_*作为一个整体,告诉编译器你希望将某个参数当作参数序列处理!例如val s = sum(1 to 5:_*)就是将1 to 5当作参数序列处理。3、指代一个集合中的每个元素。例如我们要在一个Array a中筛出偶数,并乘以2,可以用以下办法:a.

2017-09-08 15:45:56 297

转载 JAVA之BigInteger

用Java来处理高精度问题,相信对很多ACMer来说都是一件很happy的事,简单易懂。用Java刷了一些题,感觉Java还不错,在处理高精度和进制转换中,调用库函数的来处理。下面是写的一些Java中一些基本的函数的及其……头文件:import java.io.*;import java.util.*;import java.math.*;读入: Scanner c

2017-09-01 10:20:22 260

机器学习书籍大全

书籍包括xgboost_with_python.pdf,Deep Time Series Forecasting with Python.pdf,docdownloader.com_long-short-term-memory-networks-with-python.pdf,Basics for Linear Algebra for Machine Learning Discover the Mathematical Language of Data in Python.pdf,Machine Learning Algorithms.pdf

2018-08-22

PHP和MySQL.Web开发(原书第4版)高清版

PHP和MySQL.Web开发(原书第4版)高清版

2016-08-14

java 微信公众号开发案例

微信公众号开发案例,自己摸索下就能运行了

2016-08-14

微信公众平台应用开发实战

微信公众平台应用开发实战源代码

2016-08-14

R数据可视化手册代码

本书的全部代码,没有错误

2016-04-27

R数据可视化手册

R数据可视化手册

2016-04-27

数据挖掘与R语言代码

数据挖掘与R语言代码,分享快乐,这是我在大学里下载的

2016-04-24

ggplot2数据分析与图形艺术源代码

ggplot2数据分析与图形艺术源代码,里面有一些我学习的笔记

2016-04-24

spark学习总结

我是何成俭,很高兴认识你

2016-04-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除