算法
烧煤的快感
github地址:https://github.com/gh877916059?tab=repositories
展开
-
正排索引与倒排索引
正排索引与倒排索引正排索引也叫正向索引(forward index),倒排索引也叫反向索引(inverted index)。他们都是搜广推经常用到的工具,用于记录海量 对象与特征 之间的关系,这里的对象可以是商品、店铺、广告,特征可以是关键词、标签等等。假设对象为商品,特征为关键词。下面举例说明一下什么是正排索引,什么是倒排索引。对于每个商品,我们将它的标题和描述进行分词,然后可以建立如下正排索引(key是商品id,value是该商品的各个关键词的出现次数和出现位置):商品1 -> [(关键词原创 2020-07-03 23:45:43 · 2245 阅读 · 1 评论 -
准确率、召回率、F-Measure
准确率、召回率、F-Measure1.准确率(Precision)与召回率(Recall)Precision指的是检索出来的条目(比如:文档、网页等)有多少是准确的,衡量的是检索系统的查准率;Recall指的是所有准确的条目有多少被检索出来了,衡量的是检索系统的查全率。两者取值在0和1之间,数值越接近1,查准率或查全率就越高。2.综合评价指标(F-Measure)当然希望检索结果Precision越高越好,同时Recall也越高越好,但事实上这两者在某些情况下有矛盾的。比如极端情况下,我们只搜索原创 2020-07-03 23:44:24 · 1448 阅读 · 0 评论 -
彻底剖析numpy的array对象
本文深入解析了numpy的核心对象array,它的性能优势以及用法。原创 2017-11-14 23:08:01 · 1314 阅读 · 0 评论 -
深入浅出的TensorFlow数据格式化存储工具TFRecord用法教程
本文详尽地介绍了使用TFRecord的好处、必要性,然后介绍相关核心概念,最后把它整合到我们的模型训练代码当中。原创 2017-11-05 13:58:30 · 9782 阅读 · 2 评论 -
深入浅出的TensorFlow可视化工具TensorBoard用法教程(二)
本文用详尽的代码实例,教会你如何把TensorBoard应用到真实编码生产环境中。原创 2017-11-05 00:20:37 · 2559 阅读 · 3 评论 -
深入浅出的TensorFlow可视化工具TensorBoard用法教程(一)
本文详尽介绍了TensorFlow可视化工具TensorBoard的核心概念和用法示例。原创 2017-11-03 23:51:05 · 11842 阅读 · 0 评论 -
LintCode全AC题解(共331题)
LintCode全AC解(共331题)原创 2017-09-08 12:00:33 · 9382 阅读 · 3 评论 -
生成排列的非递归实现算法
本文介绍了3个生成排列的非递归实现算法,分析详尽并分别给出了其C++源码实现。原创 2017-06-29 00:23:46 · 1075 阅读 · 0 评论 -
5张动图带你看懂垃圾回收算法
本文通过5幅动图直观展示了5个垃圾回收算法的运行过程,并详尽地比较分析了这5个算法之间的优劣。翻译 2017-06-16 11:56:12 · 4401 阅读 · 2 评论 -
神奇的位运算
本文列举了十分常用而有趣的位运算技巧,它可以轻易地解决许多看似复杂问题,并且保证运行效率的最大化。原创 2017-06-16 09:55:40 · 543 阅读 · 0 评论 -
生成指定范围内无重复的随机乱序数组(JAVA实现/时间复杂度为O(n))
本文给出一个最差时间复杂度为O(n)的生成指定范围内无重复随机乱序数组的算法,以及十分健壮完备的JAVA实现。原创 2017-06-06 00:34:20 · 1702 阅读 · 0 评论 -
碰撞检测算法(2D矩形)
本文给出了一个简单实用的2D平面上矩形的碰撞检测算法,给出了JavaScript的具体实现代码(两行),并用HTML进行可视化。原创 2017-06-04 13:43:45 · 19118 阅读 · 3 评论 -
【MySQL】如何不使用OFFSET而进行高速分页
本文主要针对一个在mysql中将查询结果进行分页的常见误区,进行解析,并给出一个较为通用的高效替代方案。翻译 2017-05-31 09:42:44 · 2169 阅读 · 0 评论