iteye_18979
码龄6年
关注
提问 私信
  • 博客:36,976
    36,976
    总访问量
  • 17
    原创
  • 520,215
    排名
  • 6
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2018-07-11
博客简介:

flyfoxs

查看详细资料
个人成就
  • 获得10次点赞
  • 内容获得1次评论
  • 获得35次收藏
创作历程
  • 1篇
    2018年
  • 6篇
    2016年
  • 2篇
    2015年
  • 32篇
    2014年
  • 3篇
    2013年
  • 7篇
    2012年
  • 5篇
    2011年
TA的专栏
  • 机器学习
    1篇
  • AOP
    3篇
  • Python
  • 大数据
    12篇
  • 数据库
    3篇
  • Redis
  • JAVA
    30篇
  • J2EE
    13篇
  • Shell
    6篇
  • Oracle
    4篇
  • pentaho
    1篇
  • javascript
    1篇
  • 产品功能
    2篇
  • Clojure
    3篇
  • CGLIB
    3篇
  • 多线程
    7篇
  • cloudera
    3篇
  • Spark
    2篇
创作活动更多

仓颉编程语言体验有奖征文

仓颉编程语言官网已上线,提供版本下载、在线运行、文档体验等功能。为鼓励更多开发者探索仓颉编程语言,现诚邀各位开发者通过官网在线体验/下载使用,参与仓颉体验有奖征文活动。

368人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

白话理解: 准确率(Accuracy), 精确率(Precision), 召回率(Recall)

本文重点是在白话,不是数学上面的严格定义. 那首先要有一个业务场景,就好比上学,学习数据库,就要用到学生成绩. 在这,我们的业务场景就是对100个西瓜进行分类(已知生熟各半) 下面是针对上面场景,对各个术语的解释准确率(Accuracy): 对所有西瓜分类正确的比率.精确率(Precision): 挑出来的熟西瓜,有多少是正确的.召回率(Recall) : 50个熟西瓜,有...
原创
发布博客 2018.07.27 ·
2250 阅读 ·
2 点赞 ·
0 评论 ·
7 收藏

Solution to Fix OOM in Drill

Drill用来查询Hbase,不需要预先定义Schema,十分方便.当时如果Hbase表过大会出现OOM(OUT OF MEMORY). 查询文档后,发现通过如下2个配置可以解决. 高亮的是系统的默认值.   SELECT * FROM sys.options WHERE type in ('SYSTEM','SESSION') and name in( 'planner.memory....
原创
发布博客 2016.11.27 ·
206 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Scala浮点运算精度问题

在Spark开发的时候,直接使用java.math.BigDecimal进行浮点相乘的时候,依然有精度缺失.但是如果是纯JAVA就没有,在Scala中调用JAVA的BigDecimal就有这样的问题. 偶然之间发现Scala也实现了scala.math.BigDecimal. 换用SCALA自身的BigDecimal就没这样的问题了. 不知道深层次的原因,在这抛砖引玉,如果有人...
原创
发布博客 2016.10.15 ·
2721 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

如何使用Spark/Scala读取Hbase的数据

必须使用高亮参数启动Spark-shell,否则当你遍历RDD时会出现如下的Exceptionjava.io.NotSerializableException: org.apache.hadoop.hbase.io.ImmutableBytesWritable spark-shell --conf spark.serializer=org.apache.spark.serializ...
原创
发布博客 2016.09.05 ·
1378 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

使用Drill查询Column如果有"点"或者其他特殊字符怎么办

使用Drill查询如果字段名有"点"或者其他特殊字符怎么办, 百度, GOOGLE查询良久也没找到,在官方文档里面偶然之间查到了,也就是Drill的逃逸符[`].下面是文档连接:https://drill.apache.org/docs/lexical-structure/下面是示例.select CONVERT_FROM(t.b.BUYER_ID, 'UTF8') AS BUYER...
原创
发布博客 2016.04.20 ·
194 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Parquet列式存储格式笔记

最近偶然的因素,突然觉得这个格式很神奇,找了很多文章细读了一遍,特整理如下. 第一篇文章里面讲的很通俗,易懂.但是对于之前没有背景的,细节地方不好理解,因为里面的实例比较简单和真实案例差别比较大.深入分析Parquet列式存储格式http://www.infoq.com/cn/articles/in-depth-analysis-of-parquet-column-storag...
原创
发布博客 2016.04.13 ·
369 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

ThreadPoolExecutor中largestPoolSize和maximumPoolSize的区别

查看ThreadPoolExecutor的源代码时,发现了2个意思十分接近的变量(maximumPoolSize, largestPoolSize) .十分好奇,google,百度也无法得到答案.只好查看源码,现将结果分享出来. maximumPoolSize:是一个静态变量,在变量初始化的时候,有构造函数指定. largestPoolSize: 是一个动态变量,是记录Poll...
原创
发布博客 2016.04.11 ·
2694 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏

Hbase 笔记

  但一个CF被Flush时,其他相关的CF也会被同时Flush. 如果CF分配不均衡会导致很多小的HFile.Hbase的一条记录,只会由一个Region维护,即使有多个Column Family也不会跨越多个Region.Hbase的Memstore flush到 Hfile的触发条件有如下几种WAL大小达到阀值 内存使用达到阀值,但是阀值有2种:     ...
原创
发布博客 2015.09.17 ·
109 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

MAC下如何安装protobuf

  brew tap homebrew/versionsbrew install protobuf250  brew link --force --overwrite protobuf250protoc --version
原创
发布博客 2015.08.19 ·
268 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

【大数据笔记】白话详解Zookeeper的一致性

下面内容主要摘抄于<<Hadoop实战>>,红色高亮部分是本人添加的白话注释.   Zookeeper 是一种高性能、可扩展的服务。 Zookeeper 的读写速度非常快,并且读的速度要比写的速度更快。另外,在进行读操作的时候, ZooKeeper 依然能够为旧的数据提供服务。这些都是由于 ZooKeepe 所提供的一致性保证,它具有如下特点:【Zook...
原创
发布博客 2014.09.25 ·
537 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

细说Tomcat如何打破双亲委派(续1)

在上一篇文章里面分析WebappClassLoader.loadClass,了解了Tomcat是如何打破双亲委派的. 有兴趣的可以参考. 细说Tomcat如何打破双亲委派(有源码和图)  但是上面的分析偏重于流程,没有分析ClassLoader是如何加按照顺序寻址,然后加载对应的Class到二进制流中. WebappClassLoader.loadClass在违背双亲委派规则,自...
原创
发布博客 2014.09.24 ·
1161 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

一句话解释ThreadPoolExecutor添加线程(有源码)

ThreadPoolExecutor添加线程是通过 execute(Runnable command),此方法代码行数不多,但是由于太精炼了,不大好读懂,理解完之后,特写下笔记加深印象. 一句话解释:如果BlockingQueue没有大小限制,如果在执行的线程个数小于corePoolSize,则自动执行,否则当前线程存入BlockingQueue. 备注:如果Blockin...
原创
发布博客 2014.09.19 ·
187 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

【大数据笔记】Hadoop通过动态代理实现RPC

Hadoop所有的跨节点的通信都是通过RPC来通信的, RPC通信是需要创建Stub,一个好的RPC需要通过良好的设计确保了对上层调用的透明性. 我们下面就通过Hadoop里面最常用的心跳(JobTrack和TaskTracker)来研究一下Hadoop的RPC机制.心跳函数的调用在方法:TaskTracker.transmitHeartBeat();在此方法中会调用下面的代码段.这个方法...
原创
发布博客 2014.09.12 ·
188 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

【大数据笔记】--续谈WordCount的Bug

在之前的Blog [http://flyfoxs.iteye.com/blog/2110463]  中讨论了, hadoop在文件切割时,可能会把一个行数据切割成无意义的2块. 如果不做特别处理,这会造成数据的失真及处理错误. 经人指点,发现这个BUG不存在. Hadoop在分割文件后,后期读取中会通过一些规则来保证不会出现把一行数据分割成2行. 下面对这个后期处理机制(LineRec...
原创
发布博客 2014.09.09 ·
143 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

细说Tomcat如何打破双亲委派(有源码和图)

一句话概况: 不考虑缓存, 那么装载路径就是,先Classpath, 然后War包,当前工程, 最后才是Tomcat相关目录. 不考虑缓存,是因为缓存只是用来加快速度,对外不调用展现出的逻辑效果是可以忽略的. 下图是一个概况的流程图, 简介起见,绘图过程中移除了缓存功能. (个了感觉还是有些逻辑还是有些复杂的,图画出来了,自己看着都觉得还是不清楚,但是也没发现可以改进的地方) ...
原创
发布博客 2014.09.08 ·
4057 阅读 ·
1 点赞 ·
1 评论 ·
11 收藏

【大数据笔记】-解读hadoop命令

下面是hadoop发布版本, bin目录下面的hadoop命令的源码,hadoop命令支持好多种参数,一直记不住,想通过精度这部分代码,能记住部分参数. #!/usr/bin/env bash# Licensed to the Apache Software Foundation (ASF) under one or more# contributor license ag...
原创
发布博客 2014.09.03 ·
202 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

如何在JAVA中创建一个不可变对象

1. 对象的状态在构造函数之后都不能被修改,任何修改应该通过创建一个新对象来实现.2. 所有的对象属性应该都设置为final3. 对象创建要正确,例如:对象的应用不能在构造函数中被泄露出去4. 对象要设置为final,确保不要继承的Class修改了immutability特性 上面这些规则不是100%的不能打破,比如String对象hash属性就不是一个final对象,但是...
原创
发布博客 2014.08.29 ·
592 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

【大数据笔记】--浅谈WordCount的Bug

最近精读Hadoop WordCount的示例,发现里面应该存在一个"可能的"Bug,现斗胆发出,希望有高人指点. Bug描述:WordCount数单词的时候,如果遇到大文件会对文件进行切分.但是切分是按照字节来进行的,完全有可能会将一个单词切分成2个单词,这样也就可能会创造2个不存在的单词. 相关代码:WordCount main 函数   ( FileInp...
原创
发布博客 2014.08.28 ·
166 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

古怪的泛型

Java1.5引入的泛型是一个比较大的进步,让人用的也很爽.但是java的泛型是基于类型擦除,也就是只在编译期才有泛型的存在,在运行时根本没有泛型什么事. 这也造成了泛型不能支持下面这些情况,而这些是在C++里面是都得到了支持的. 不支持New操作 Java代码 class SomeContainer<E>  {      E creat...
原创
发布博客 2014.08.20 ·
140 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

一键安装Maven/Ant (使用Yum)

在Centos下面如何安装Maven,查了很多地方,都是: 下载,解压,复制.... 今天偶然发现了一个通过Yum安装maven的办法,就2个命令:  wget http://repos.fedorapeople.org/repos/dchen/apache-maven/epel-apache-maven.repo -O /etc/yum.repos.d/epel-ap...
原创
发布博客 2014.08.15 ·
240 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多