• 我的消息
  • 我的博客
  • 我的学院
  • 我的下载
  • 我的收藏
  • 消息
  • 搜索条件:
    点击返回全部
    全部文章 > {categoryName }
    • Hadoop 中文编码相关问题 -- mapreduce程序处理GBK编码数据并输出GBK编码数据

      最近些统计程序时,使用了原生的java hadoop,以前使用streaming 模式, 用awk脚本写时,没有遇到编码问题,原生的java hadoop程序,在处理gb18030格式log时,当输出...

      转载
      2017-04-14 19:49:56
      392
      0
    • Hadoop中Combiner的使用

      转自:http://blog.csdn.net/ipolaris/article/details/8723782 在MapReduce中,当map生成的数据过大时,带宽就成了瓶颈,怎样精简压缩传给R...

      转载
      2017-03-14 10:23:38
      216
      0
    • GBK与unicode转换

      最近写unicode分词时,需要处理GBK输入,用到GBK与Unicode之间的转换 转自http://www.latelee.org/programming-under-linux/gbk-t...

      转载
      2017-01-12 16:22:58
      253
      0
    • 【C++】使用libxml解析XML文件

      OpenCV中使用FileStorage创建和解析XML文件。但FileStorage不能处理节点为空的情况,且对属性也不友好。例子见这里。 libxml是C接口的处理xml文件的开源代码库。可以在这...

      转载
      2016-11-09 09:31:47
      403
      0
    • C++11:POD数据类型

      啥是POD类型? POD全称Plain Old Data。通俗的讲,一个类或结构体通过二进制拷贝后还能保持其数据不变,那么它就是一个POD类型。 平凡的定义 1.有平凡的...

      原创
      2016-11-03 10:48:26
      188
      0
    • 玩转Google开源C++单元测试框架Google Test系列(gtest)之六 - 运行参数

      转自http://www.cnblogs.com/coderzh/archive/2009/04/10/1432789.html 一、前言 使用gtest编写的测试案例通常本身就是一个可执...

      转载
      2016-11-01 09:17:23
      252
      0
    • Linux动态加载动态链接库

      函数 描述 #include头文件定义如下四个函数 dlopen 使对象文件可被程序访问 dlsym   获取执行了 dlopen 函数的对象文件中的符号的地址 dlerror  返回上一...

      转载
      2016-10-25 15:10:06
      190
      0
    • shell中test命令用法详解

      test命令用法。功能:检查文件和比较值   1)判断表达式   if test  (表达式为真)   if test !表达式为假   test 表达式1 –a 表达式2...

      转载
      2016-10-25 09:37:19
      212
      0
    • hadoop相关优化参数

      hadoop为用户作业提供了多种可配置的参数,以允许用户根据作业特点调整这些值 使作业运行效率达到最优。 程序编写规范 (1)设置Combiner 如果是一大批MR程序,如果可以设...

      转载
      2016-10-10 10:41:18
      513
      0
    • 如何在hadoop中控制map的个数

      hadooop提供了一个设置map个数的参数mapred.map.tasks,我们可以通过这个参数来控制map的个数。但是通过这种方式设置map的个数,并不是每次都有效的。原因是mapred.map....

      转载
      2016-09-27 12:32:33
      233
      0
  • 学院
  • 下载
  • 消息