- 博客(3)
- 收藏
- 关注
原创 Elasticsearch生产环境中的一些问题
1. low water disk某个节点的硬盘空间超过85%时,es将不会再往该节点分配replica。这在重启后时,会发现集群状态始终是yellow,有一些unassigned shards。此时可以不停机的进行集群配置。PUT _cluster/settings{ "transient": { "cluster.routing.allocation.disk.wa
2017-07-18 21:50:57 3537
转载 Kmeans缺点分析
K均值聚类是一种应用广泛的聚类技术,特别是它不依赖于任何对数据所做的假设,比如说,给定一个数据集合及对应的类数目,就可以运用K均值方法,通过最小化均方误差,来进行聚类分析。因此,K均值实际上是一个最优化问题。在一些已知的文献中论述了K均值聚类的一下一些缺点:K均值假设每个变量的分布是球形的;所有的变量具有相同的方差;类具有相同的先验概率,要求每个类拥有相同数量的观测以上任一
2017-07-17 22:47:47 4146
原创 Opencc简体、繁体转换
除了写代码进行简体、繁体转换外,opencc也支持命令行进行转换。opencc --help可以看到具体信息。参数: -i [file], --input=[file] 从 [file] 读取原始文本。 -o [file], --output=[file] 将转换后的文本写入 [file]. -c [file], --config=[file] 从 [f
2017-07-02 17:24:40 3646
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人