data science
文章平均质量分 84
kid551
用boring的方式为有趣铺平道路,GeekArtT
展开
-
ElasticSearch 索引的存储机制推演
ElasticSearch 作为开源的搜索引擎,需要依赖的一个重要数据结构就是 inverted index(倒排索引)。inverted index 通常庞大、且建立过程相当耗时,于是,如何存储 inverted index 就变成了一件极为要紧的事情。显然,inverted index 不能简单地被放在 memory 中,它还必须做对应的持久化,让这些已经建立的 inverted index 可以被复用。ElasticSearch 是基于 Lucene 来构建的,在 Lucene 的世界里,inver原创 2021-04-15 17:19:49 · 241 阅读 · 0 评论 -
使用Bin Model来回答Machine Learning机制的合理性
MotivationMachine leanring的核心思想是:通过大量的数据来拟合出模型(hypothesis)的参数,进而使用参数齐全的模型来做出预测。模型的本质是用数学的形式来描述你对数据的一种偏见、看法和主观感受。它以数学的方式阐述了:“你认为”这堆数据是按照什么样的规则被产生的。那么既然是“主观认为”,要将其变成令人信服的相对客观的规律,就需要你使用各种方式来证明你的这种“认为”是...原创 2019-06-08 15:07:37 · 627 阅读 · 0 评论