从今天开始,我把所有18年起的TODO,都同步到这篇文章。
一方面是方便自己常“回来看看“,记得解决这些疑惑;
另一方面,希望知道/有解决思路的前辈们能留言或者(QQ/WX911283415)指点一二,感激!
(序列中所有非链接字体以及【】中的文字,可在文章中搜索定位)
------------------------------------------------------分割线--------------------------------------------------------
十五、2018年10月03日
linux-like相关erros解决
【Input/output error】:大部分命令,比如reboot、ls、clear、cat等等,都报Input/output error
十四、2018年09月30日
(二):Flink概述,Flink如何支持批流处理,程序流程
- 容错机制的类比、计算资源调度的类比
- Flink纯自动化内存管理?连基本的额配置都不需要?
- 流式中的批处理原理
十三、2018年09月05日:
kafka(二)测一测各种参数的合适值,性能优化,生产者消费者实战
不少的TODO
十二、2018年08月08日:
- 【消费者线程等待时间超时,中断线程】
- 【验证这样写入数据是否有重写漏写】
十一、
Elasticsearch【Elasticsearch写入性能优化】
已解决:
1、Elasticsearch进阶(一)写入性能基准测试写入性能优化(56小时到5小时),chunk_size探讨
十、2018年06月28日:
查看ES集群中的数据分布【如何查看数据在ES集群中的分布情况,有没有类似Hadoop那样的浏览文件夹的操作】
九、2018年06月23日:
- 关于Object类一些重要方法的深入温习及认真的重载
- 第一段测试代码中,两个Integer引用未一起修改【System.out.println(g + “–” + n);】
原始类型非线程安全的测验
已解决:
2018年06月24日Java原始类型的非线程安全以及AtomicInteger
八、2018年06月06日
- elasticsearch导入数据某字符串中有某个字段的多个值(分隔符隔开),如何解析传递这么个数组到JSON 【如何解析传递这么个数组】
七、2018年05月20日
- ElasticSearch中的参数discovery.zen.ping_timeout【什么时候ping?这里的ping与其他大数据解决方案的心跳报告有联系吗?】
- ElasticSearch单播discovery.zen.ping.unicast.hosts 【不需要禁用多播吗?看源码,单播如何体现(实现)的。】
六、2018年05月15日
@DeveloperApi
class OneToOneDependency[T](rdd: RDD[T]) extends NarrowDependency[T](rdd) {
override def getParents(partitionId: Int): List[Int] = List(partitionId)
}
五、2018年05月12日
- 对elasticsearch的regexp的正确操作
- fuzzy模糊查询”fuzziness”、”prefix_length” 、”max_expansions”三个参数的正确理解及实践
- span_not中的pre、post、dist参数
- 对elasticsearch的regexp的正确操作
- fuzzy模糊查询”fuzziness”、”prefix_length” 、”max_expansions”三个参数的正确理解及实践
- span_not中的pre、post、dist参数
四、2018年05月10日
实验Windows远程提交Spark作业时【Skip remote jar
,没找到合理的解释】
三、2018年03月01日
mapreduce/shuffle调优综述
二、2018年02月27日
Java多线程getName()【为什么构造器设置name不能同步到getName()方法?】
一、2018年01月12日
Spark源码阅读,自己写注释,常常不满足scalastyle【scalastyle需要符合什么标准】