关闭
当前搜索:

推荐引擎算法学习导论

推荐引擎算法学习导论:协同过滤、聚类、分类作者:July。出处:结构之法算法之道引言    昨日看到几个关键词:语义分析,协同过滤,智能推荐,想着想着便兴奋了。于是昨天下午开始到今天凌晨3点,便研究了一下推荐引擎,做了初步了解。日后,自会慢慢深入仔细研究(日后的工作亦与此相关)。当然,此文也会慢慢补充完善。    本文作为对推荐引擎的初步介绍的一篇导论性的文章,将略去大部分的具体细节,侧重用最简单...
阅读(74419) 评论(55)

程序员编程艺术第二十六章:基于给定的文档生成倒排索引(含源码下载)

第二十六章:基于给定的文档生成倒排索引的编码与实践作者:July、yansha。出处:结构之法算法之道引言    本周实现倒排索引。实现过程中,寻找资料,结果发现找份资料诸多不易:1、网上搜倒排索引实现,结果千篇一律,例子都是那几个同样的单词;2、到谷歌学术上想找点稍微有价值水平的资料,结果下篇论文还收费或者要求注册之类;3、大部分技术书籍只有理论,没有实践。于是,朋友戏言:网上一般有价值的东西不...
阅读(72763) 评论(43)

程序员编程艺术第二十五章:Jon Bentley:90%无法正确实现二分查找

第二十五章:二分查找实现(Jon Bentley:90%程序员无法正确实现)作者:July出处:结构之法算法之道引言    Jon Bentley:90%以上的程序员无法正确无误的写出二分查找代码。也许很多人都早已听说过这句话,但我还是想引用《编程珠玑》上的如下几段文字:  “二分查找可以解决(预排序数组的查找)问题:只要数组中包含T(即要查找的值),那么通过不断缩小包含T的范围,最终就可以找到它...
阅读(72087) 评论(127)

编程艺术第二十三~四章&十一续:杨氏矩阵查找,倒排索引关键词Hash编码

第二十三、四章:杨氏矩阵查找,倒排索引关键词Hash不重复编码实践作者:July、yansha。编程艺术室出品。出处:结构之法算法之道。前言    本文阐述两个问题,第二十三章是杨氏矩阵查找问题,第二十四章是有关倒排索引中关键词Hash编码的问题,主要要解决不重复以及追加的功能,同时也是经典算法研究系列十一、从头到尾彻底解析Hash表算法之续。    OK,有任何问题,也欢迎随时交流或批评指正。谢...
阅读(74722) 评论(49)

[置顶] 从头到尾彻底理解KMP(2014年8月22日版)

从头到尾彻底理解KMP 作者:July 时间:最初写于2011年12月,2014年7月21日晚10点 全部删除重写成此文,随后的半个多月不断反复改进。后收录于新书《编程之法:面试和算法心得》第4.4节中。 1. 引言 本KMP原文最初写于2年多前的2011年12月,因当时初次接触KMP,思路混乱导致写也写得混乱。所以一直想找机会重新写下KMP,但苦于一直以来对KMP的理解始终不够,故才迟迟没有修改本文。 然近期因开了个算法班,班上专门讲解数据结构、面试、算法,才再次仔细回顾了这个K...
阅读(308474) 评论(404)

Nginx源码剖析之内存池,与内存管理

Nginx源码剖析之内存池,与内存管理作者:July、dreamice、阿波、yixiao。出处:http://blog.csdn.net/v_JULY_v/。引言        Nginx(发音同 engine x)是一款轻量级的Web 服务器/反向代理服务器及电子邮件(IMAP/POP3)代理服务器,并在一个BSD-like 协议下发行。由俄罗斯的程序设计师Igor Sysoev所开发,最初供...
阅读(64426) 评论(66)

程序员编程艺术第一~二十二章集锦与总结(教你如何编程)

程序员编程艺术第一~二十二章集锦与总结(教你如何编程) 作者:July、编程艺术室。出处:http://blog.csdn.net/v_JULY_v 。题记        好久没更新博客了,虽只有一个月,但对我来说,已是长久。最重要的是11月初来北京后,在这近一个月找工作的过程中,面试、拜访、购书、读书,亦许久没有敲代码了,手异常生疏,虽只有一个月,但对我来说,仍已是长久。为了表示我一直在关注着本...
阅读(57234) 评论(35)

从Trie树(字典树)谈到后缀树(10.28修订)

从Trie树(字典树)谈到后缀树作者:July、yansha。出处:http://blog.csdn.net/v_JULY_v 。 引言    常关注本blog的读者朋友想必看过此篇文章:从B树、B+树、B*树谈到R 树,这次,咱们来讲另外两种树:Tire树与后缀树。不过,在此之前,先来看两个问题。    第一个问题: 一个文本文件,大约有一万行,每行一个词,要求统计出其中最频繁出现的前10个词,...
阅读(144258) 评论(95)

程序员编程艺术第二十一~二章:发帖水王及扩展,与最短摘要生成(12.07修订)

第二十一~二十二章:出现次数超过一半的数字,最短摘要的生成前言   咱们先来看两个问题:    第一个问题来自编程之美上,Tango是微软亚洲研究院的一个试验项目,如图1所示。研究院的员工和实习生们都很喜欢在Tango上面交流灌水。传说,Tango有一大“水王”,他不但喜欢发帖,还会回复其他ID发的每个帖子。坊间风闻该“水王”发帖数目超过了帖子总数的一半。如果你有一个当前论坛上所有帖子(包括回帖)...
阅读(48037) 评论(49)

十月下旬腾讯,网易游戏,百度迅雷校园招聘笔试题集锦(第271-330题)

十月下旬腾讯,网易游戏,百度最新校园招聘笔试题集锦(第271-330题)引言    此文十月百度,阿里巴巴,迅雷搜狗最新面试十一题已经整理了最新的面试题70道,本文依次整理腾讯,网易游戏,百度等各大公司最新校园招聘的笔试题,后续将继续整理十月下旬的笔/面试题。腾讯2011.10.15校园招聘会笔试题1、下面的排序算法中,初始数据集的排列顺序对算法的性能无影响的是(B)A、插入排序...
阅读(82052) 评论(67)

编程艺术第十六~第二十章:全排列/跳台阶/奇偶调序,及一致性Hash算法

第十六~第二十章:全排列,跳台阶,奇偶排序,第一个只出现一次等问题作者:July、2011.10.16。出处:http://blog.csdn.net/v_JULY_v。引言    最近这几天闲职在家,一忙着投简历,二为准备面试而搜集整理各种面试题。故常常关注个人所建的Algorithms1-14群内朋友关于笔试,面试,宣讲会,offer,薪资的讨论以及在群内发布的各种笔/面试题,常感言道:咱们这...
阅读(59911) 评论(56)

微软面试100题2010年版全部答案集锦(含下载地址)

微软等数据结构+算法面试100题全部答案集锦作者:July、阿财。时间:二零一一年十月十三日。引言     无私分享造就开源的辉煌。     今是二零一一年十月十三日,明日14日即是本人刚好开博一周年。在一周年之际,特此分享出微软面试全部100题答案的完整版,以作为对本博客所有读者的回馈。     一年之前的10月14日,一个名叫July (头像为手冢国光)的人在一个叫csdn的论坛上开帖分享微软...
阅读(200061) 评论(128)

十月上旬百度,阿里巴巴,迅雷搜狗最新面试七十题(第201-270题)

十月百度,阿里巴巴,迅雷搜狗最新面试七十题(第201-270题)引言   当即早已进入10月份,十一过后,招聘,笔试,面试,求职渐趋火热。而在这一系列过程背后浮出的各大IT公司的笔试/面试题则蕴含着诸多思想与设计,细细把玩,思考一番亦能有不少收获。    上个月,本博客着重整理九月腾讯,创新工场,淘宝等公司最新面试十三题,此次重点整理百度,阿里巴巴,迅雷和搜索等公司最新的面试题。同上篇一样,答案望...
阅读(94939) 评论(115)

从上百幅架构图中学得半点大型网站建设经验(上)

从上百幅架构图中学大型网站建设经验(上)引言    近段时间以来,通过接触有关海量数据处理和搜索引擎的诸多技术,常常见识到不少精妙绝伦的架构图。除了每每感叹于每幅图表面上的绘制的精细之外,更为架构图背后所隐藏的设计思想所叹服。个人这两天一直在搜集各大型网站的架构设计图,一为了一饱...
阅读(48493) 评论(23)

搜索引擎技术之概要预览

搜索引擎技术之概要预览前言    近些天在学校静心复习功课与梳理思路(找工作的事情暂缓),趁闲暇之际,常看有关搜索引擎相关技术类的文章,接触到不少此前未曾触碰到的诸多概念与技术,如爬虫,网页抓取,分词,索引,查询,排序等等,更惊叹于每一幅精彩的架构图,特此,便有记录下来的冲动,以作备忘。    本文从最基本的搜索引擎的概念谈起,到全文检索的概念,由网络蜘蛛,分词技术,系统架构,排序的讲解(结合go...
阅读(48043) 评论(50)

九月腾讯,创新工场,淘宝等公司最新面试三十题(第171-200题)

九月腾讯,创新工场,淘宝等公司最新面试三十题(第171-200题)引言        曾记否,去年的10月份也同此刻一样,是找工作的高峰期,本博客便是最初由整理微软等公司面试题而发展而来的。如今,又即将迈入求职高峰期--10月份,所以,也不免关注了网上和我个人建的算法群Algorithms1-12群内朋友发布和讨论的最新面试题。特此整理,以飨诸位。至于答案,望诸位共同讨论与思考。最新面试十三题...
阅读(147415) 评论(351)

B树的C实现

从B树谈到R树之B树的C实现作者:weedge,July。编程艺术室出品。前言    代码大全的作者Steve McConnell曾称,他所见识的任何一本书都不是某一个人能完全独立即能完成的。吾深以为然。    本blog内的文章十有八九系我个人参考资料原创所作,与此同时十有二三系本人与吾的朋友共同创作完成。所以,诸君在浏览本博客内任何一篇文章时,务必尊重他人劳动成果。当然,有任何问题,欢迎随时不...
阅读(31842) 评论(36)

程序员编程艺术第十二~十五章:IP访问次数,回文等问题(初稿)

程序员编程艺术第十二~十五章:中签概率,IP访问次数,回文等问题(初稿)作者:上善若水.qinyu,BigPotato,luuillu,well,July。编程艺术室出品。前言    本文的全部稿件是由我们编程艺术室的部分成员:上善若水.qinyu,BigPotato,luuillu,well,July共同完成,共分4个部分,即4道题:第一部分、从一道题,漫谈数据结构、以及压缩、位图算法,由上善若...
阅读(35155) 评论(60)

从Hadoop框架与MapReduce模式中谈海量数据处理(含淘宝技术架构)

从hadoop框架与MapReduce模式中谈海量数据处理前言    几周前,当我最初听到,以致后来初次接触Hadoop与MapReduce这两个东西,我便稍显兴奋,觉得它们很是神秘,而神秘的东西常能勾起我的兴趣,在看过介绍它们的文章或论文之后,觉得Hadoop是一项富有趣味和挑战性的技术,且它还牵扯到了一个我更加感兴趣的话题:海量数据处理。    由此,最近凡是空闲时,便在看“Hadoop”,“...
阅读(175330) 评论(61)

重启开源,分享无限--微软面试187题精选

重启开源,分享无限--诚邀你加入微软面试187题的解题中   前期回顾     我想,只要是稍微浏览过我博客的朋友都知道,本博客内总体上大致分为两个部分的内容:1、算法(如十六个经典算法研究系列);2、面试与编程(涉及到微软面试100题系列,程序员编程艺术系列,海量数据处理...
阅读(33897) 评论(18)
165条 共9页首页 上一页 1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:13599620次
    • 积分:50385
    • 等级:
    • 排名:第70名
    • 原创:159篇
    • 转载:0篇
    • 译文:6篇
    • 评论:13930条
    博主简介
    July,于2010年10月11日开始在CSDN上写博(搜索:“结构之法”,进入本博客),博客专注面试、算法、机器学习。2015年正式创业,七月在线创始人兼CEO,公司官网:七月在线(https://www.julyedu.com/),微博@研究者July。新书《编程之法》15年10月14日起正式上市。JulyEdu AI 交流Q群:204292834。July,2018/1月。
    July和他朋友们的创业平台
    我的微博
    July新书《编程之法》上市
    博客专栏
    最新评论