自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(38)
  • 收藏
  • 关注

原创 随机的力量(2) - 矩阵比较

问题: 给定三个n×n矩阵A, B, C, 怎么快速判别A×B 是否等于C?

2015-11-02 22:48:44 1344

原创 随机的力量(1) - The power of random two choices

我们都知道对于哈希函数来说,有一个绕不开的话题就是冲突。 当N个object通过随机函数映射到N个桶的时候,可能由于冲突而出现Hash(x) = Hash(y)的情况。经典的处理哈希冲突的方法包括链表法(Separate Chaining)和开放寻址(Open Addressing)。对于链表法来说,冲突位置的链表长度越长,算法效率越差。问题1: 如果N个Object随机哈

2015-11-01 00:43:52 2985

原创 [Leetcode.python] 002. Add Two Numbers

题目002:Add Two Sum (https://leetcode.com/problems/add-two-numbers/)给定两个链表表示两个整数,输出两个整数之和的链表表示解答:直接模拟整数求和过程即可 def addTwoNumbers(self, l1, l2): length1 = 0 listnode =

2015-06-21 22:11:11 588

原创 [Leetcode.python] 001. Two Sum

在学习新语言Python, 决定使用Python刷刷Leetcode.题目001:Two Sum (https://leetcode.com/problems/two-sum/)大意,给定一个数组nums和一个数target,确定有且只有一对坐标index1, index2, 使得nums[index1] + nums[index2] == target解答

2015-06-21 21:09:52 719

原创 搜狗输入法的愚人节狂想

一年一度的愚人节刚刚过去。一起来领略一下人类科技在这一天的狂想吧:http://www.iqiyi.com/a_19rrhayhsd.html在这里,特别推荐搜狗输入法的两个有趣的点子:    2014年:搜狗Typany输入环    2015年:搜狗“智”齿下面且看,2014年的Typany输入环:2015年新鲜出炉的搜

2015-04-02 08:01:20 913

原创 科技的发展(1) - 中文输入法

关于科技的发展系列,我想谈谈的第一个话题便是中文输入法。回想起二十年前,刚接触计算机时,第一个让人困扰的事便是学习五笔。那时还没有用户痛点的说法,可以熟练使用五笔输入法还是看起来颇为高大上的感觉。不能免俗,记忆里的我还是费了一些劲的,虽然最终也没有能够练就这门“上乘”武功。如今想来也只依稀记得“烟”字的五笔编码是old,还是靠这个编码的巧合。于是乎,我有一个念头,当下是否还有人在使

2015-03-28 17:55:28 1571

原创 《机器学习那些事》摘要

《机器学习那些事》介绍了一些机器学习应用中需要了解的“民间知识”。 原文为: A Few Useful Things to Know about Machine Learning摘录若干要点:1. 学习 = 表示 + 评价 + 优化    表示(Representation) : 学习器的假设空间(hypothesis space)    评价(Evalua

2014-06-22 15:10:26 1185

原创 Data Mining Methods for Recommender Systems

一篇不错的文章,总结了数据挖掘方法在推荐系统中的应用。

2014-06-22 13:31:19 722

原创 Make a dent in the universe

重读《一个数学家的辩白》,犹如第一次阅读时一样,我被文中的雄心所鼓舞。“雄心是世上几乎所有最佳工作成果的驱动力。”最高尚的雄心壮志是在自己身后留下某种永存的价值在这平坦的沙滩上,海洋与大地间,我该建起或写些什么,来阻止夜幕的降临?告诉我神秘的字符,去喝退那汹涌的波涛,告诉我时间的城堡,去规划那更久的白昼。

2014-06-22 13:04:24 6003

原创 Explicit Semantic Analysis (ESA)

有别于LSA (Latent Semantic Analysis), 下列文章提出一种ESA (Explicit Semantic Analysis), 并介绍如何使用ESA来进行语义相关性和文本分类工作。 文章的基本思路其实也很简单,就是基于wikipedia网站内容,生成每一个曾经出现在wikipedia文章中的单词的语义表示。 每个单词的语义表示是一个高维向量, 而对应的每一个维就是wiki

2014-06-14 23:19:43 3188

原创 百度技术沙龙 - 大数据场景下主题检索应用

第48期百度技术沙龙上的《大数据场景下主题检索应用》讲座介绍了很多训练大规模主题模型的技术细节。讲座回来后,我粗略整理了下讲座上涉及的主题模型和训练大规模模型相关的资料和文献。1. 主题模型的发展历史    a. 布尔模型 Boolean model    b. 向量空间模型 VSM (Vector space model)    c. 潜在语义索引 LSI (Latent

2014-05-03 14:36:09 1363

原创 百度技术沙龙 - 广告数据上的大规模机器学习

上个月,参加了百度技术沙龙, 夏粉的《广告数据上的大规模机器学习》讲座介绍了大规模机器学习中的若干重要问题。遗憾的是,百度的相关算法没有公开的论文。1.  数据处理    目标: 获取信息, 去除噪音    机器学习技术点: 选择对点击概率分布 预估足够多样本    解决方法: a. 不可见和不完整样本过滤; b. 样本采样; c. 异常样本检测    算法:a. 百度

2014-05-03 14:00:40 4370

原创 文本索引与检索

本质上,很多实际需要解决的问题归根到底都是搜索问题 - 在某个空间中寻找特定的目标。而, 文本检索又是其中最典型最基础的一种。文本检索之所以重要,也是因为很多更复杂对象或者结构的检索可以转化为文本检索,或者参考利用文本检索的思想。谈及文本检索, 各种各样的算法不一而足。大体可以分成两类:        1. 模式固定,文本不定                这类算法的一个典型场景: 事先定

2014-04-20 18:53:35 2868 1

原创 《大明劫》对团队建设的启示

近日观看电影《大明劫》,在感叹大明帝国风雨飘摇,日落西山的同时,让我感触最多的却是另外两点:凝聚力和信任凝聚力    一个国家,一个大型组织。是否其中的每一个人都在同一条船上了呢? 在大厦将倾的时候,帝国的子民们都在干什么呢?    1. 崇祯恐怕如热锅上的蚂蚁焦虑非常。祖传的基业,大明王朝的生死,理想和现实......    2. 孙传庭一腔热血,死而后已,却面临皇帝的猜

2014-02-09 17:22:34 1968

转载 Good Tech Lead, Bad Tech Lead

Good Tech Lead, Bad Tech LeadJan 30thA brief guide to tech leadership at Foursquare, inspired by Ben Horowitz’s Good Product Manager, Bad Product Manager.TeamworkGood tech leads ac

2014-02-09 12:33:40 1254

原创 百度计算广告学沙龙学习笔记 - 品牌展示广告

第三期百度计算广告学沙龙( http://wenku.baidu.com/course/view/1488bfd5b9f3f90f76c61b8d ) 介绍了内容匹配广告和展示广告相关技术。本博客记录观看品牌展示广告部分的一些笔记, 绝大多数为原slide内容,只做简单的整理。1. 基本概念展示广告分类     按广告作用分类:品牌广告(Brand Disp

2014-02-06 19:23:34 3062

原创 百度计算广告学沙龙学习笔记 - 内容匹配广告

第三期百度计算广告学沙龙( http://wenku.baidu.com/course/view/1488bfd5b9f3f90f76c61b8d ) 介绍了内容匹配广告和展示广告相关技术。本博客记录观看内容匹配广告部分的一些笔记, 绝大多数为原slide内容,只做简单的整理。

2014-02-05 18:53:55 5348

原创 关于《最强大脑》周玮的一些想法

《最强大脑》上周玮的表现非常震撼, 激起了网络上无数的评论。 其中,涉及最多的要数大量关于”怎么快速计算这些看起来吓人的算式“的讨论。     比如:        1. 果壳上就有一篇详细的讨论 (http://www.guokr.com/article/437913/ )        2. 知乎上的讨论(http://www.zhihu.com/question/22549436

2014-02-03 15:20:19 4122

原创 计算广告学(Computational Advertising)学习资料

整理收集计算广告学方面的学习资料学习课程计算广告学 - 刘鹏     http://study.163.com/course/introduction.htm?courseId=321007#/courseDetail第一期百度计算广告学沙龙     http://www.youku.com/playlist_show/id_20672162.htm

2014-01-29 19:59:43 4268

原创 深度学习(Deep Learning) 学习资料

深度学习,是当前热门的机器学习领域。 最近开始想系统学习一下, 整理了一些网上学习资料, 也供有公共兴趣的朋友参考。如果有好的推荐,也欢迎给我留言。学习网站1. Deep Learning 101    http://markus.com/deep-learning-101/?utm_campaign=Manong_Weekly_Issue_11&utm_med

2014-01-26 17:21:24 6945

原创 使用tcpdump和wireshark对android手机进行网络抓包分析

一个简单的对手机进行网络抓包分析的方法:1. 编译tcpdump    从tcpdump的官方网站下载源代码并编译    tcpdump官方网站: http://www.tcpdump.org/2. 在手机中安装tcpdump    只需要把编译好的tcpdump程序拷贝到手机中,并赋予权限    adb push /data/local/tcpdum

2014-01-26 11:50:13 3088

原创 优先队列(Priority Queue)变种和加强

《Handbook of Data Structures and Applications》介绍了一系列针对不同需求的设计精妙的Priority Queue和参考文献。下面包含这些Priority Queue之间的关系: Queue队列 (Queue) 是一个基本的数据结构。支持先进先出 (FIFO: First In First Out) 的线形表。主要支持下面两

2014-01-05 17:49:39 3305

原创 谁是冠军?

一道关于奥运会排名的有趣题目最近日本国东京刚获得2020奥运会举办权。Three Body不由想起往年各种奇葩奥运排行榜。大家应该对奥运金牌榜(按获得的金牌数目排序),奥运奖牌榜(按获得的金银铜奖牌总数排序)很熟悉。 除此之外,还有好多排行榜估计各位还不一定听说过。比如,澳大利亚"为了国家的荣誉"实行银牌榜(按银牌数目排序), 新西兰国统计局推出奥运效率榜(按人均金牌数目排序),

2013-12-30 23:57:13 1287

原创 Diffusion of innovations(创新扩散)

创新扩散理论, 美国学者Rogers提出的关于推广传播新观点新技术的理论。创新扩散,会经历五个阶段: Knowledge, Persuasion, Decision, Implementation, Confirmation:StageDefinitionKnowledge    In this stage the individual

2013-12-24 23:46:00 3373

原创 Hype Cycle (技术成熟度曲线)

Hype Cycle, 直译为炒作周期, 又称为技术成熟度曲线。 名为炒作,实是为了表示技术的受关注程度。这个模型由著名咨询公司Gartner发布,包含了Gartner对技术发展周期的预测。 Hype Cycle提供给我们Gartner公司对各种技术所处的发展阶段和趋势的预测。

2013-12-24 00:40:27 10209

原创 问题的难度

关于问题,我们是否都能高效解决?我们是否能够解决?这是计算机科学中可计算性和计算复杂度研究的问题。《算法学》一书的第7章和第8章对问题难度进行介绍和整理。第7章主要讨论可计算问题的难解程度;而第8章主要讨论不可计算问题。        上图将所有问题分成4个部分: 易解问题, 难解问题, 不可判定问题,高度不可判定问题。易解问题和难解问题属于具有理论上的可计算性。虽然难解问题在目前

2013-12-22 23:11:46 2100

原创 写给妹妹的编程札记 6 - 搜索实战: 单词博弈

最近,CSDN上的在线编程比赛中,有一道题目《单词博弈》。这道题目是一个很好的可以使用搜索来解决的例子。题目详情本第一次在线编程大赛由文思海辉冠名,题目如下:甲乙两个人用一个英语单词玩游戏。两个人轮流进行,每个人每次从中删掉任意一个字母,如果剩余的字母序列是严格单调递增的(按字典序a < b < c <....<z),则这个人胜利。两个人都足够聪明(即如果有赢的方案,都不会选输的方案 ),

2013-12-21 21:31:25 1998 1

原创 《异类 - 不一样的成功启示录》读书笔记

《异类(Outlier)》是Malcolm Gradwell的一个著名作品。中间有些内容以前也看过,这次系统重看了下。每次都有不少启示。* 10000小时的标准        “一个人的技能要达到世界水平, 他的练习时间就必须超过10000个小时 - 任何行业都不例外。” 10000个小时相当于每天练习3个小时,或者每周练习20个小时,总共持续10年的练习时间。 书中列举了若干个实

2013-12-08 10:30:09 1966

原创 写给妹妹的编程札记 5 - 搜索: 迷宫问题 - 广度优先搜索

让我们也使用广度优先搜索来解决一下迷宫问题,对比一下。

2013-12-05 02:45:27 1547

原创 写给妹妹的编程札记 4 - 搜索: 迷宫问题 - 深度优先搜索

《写给妹妹的编程札记 3 - 穷举: 深度优先搜索/广度优先搜索》中, 我们了解到基本的深度优先搜索和广度优先搜索。 来点实战吧, 使用搜索技术来解决一些实际的问题。         首先来看看怎么使用深度优先搜索解决迷宫问题?        假设,输入的迷宫如下列数据表示:                 第一行包含两个整数,分别表示行数 - r 和列数 - c

2013-12-05 01:31:31 1558

原创 写给妹妹的编程札记 3 - 穷举: 深度优先搜索/广度优先搜索

前文,我们讨论了从循环遍历到搜索基本框架,并解决了一个经典的八皇后问题。对搜索剪枝也有了一些基本的了解。 下面, 我们来看看搜索的两个最基本的策略: 深度优先搜索和广度优先搜索。        Wikipedia上有比较简单的介绍 (英文版包含更多的参考信息)                深度优先搜索: http://zh.wikipedia.org/wiki/%E6%B7%B1%E5%

2013-11-24 12:02:03 1930

原创 写给妹妹的编程札记 - 排序

排序, 顾名思义,就是将一个给定集合的元素按定义的比较函数排列为有序状态。 下面是一些常见的排序方法, 应该熟悉掌握这些排序方法, 了解它们的优缺点,在正确的场景使用它们。

2013-11-24 01:01:40 879

原创 出自上帝之手的精妙算法 - Algorithm from THE BOOK (2)

接着 出自上帝之手的精妙算法 - Algorithm from THE BOOK (1)51. Fixed Parameterized Algorithm for Vertex Cover     http://www.sciencedirect.com/science/article/pii/S002001909700213552. Rabin-Karp

2013-11-23 21:44:49 6144

原创 出自上帝之手的精妙算法 - Algorithm from THE BOOK (1)

《Proofs from THE BOOK》是一本非常出名的书籍, 收录了不少精妙的证明。        为此, 在cstheory.stackexchange.com上有人召集大家讨论加入上帝有一本书收集精妙的算法,那么,那本书应该包含一些什么算法呢? "Proof from THE BOOK" 中译本翻译为“来自圣经的证明” 或者 “数学天书中的证明”。 天书,听上去似

2013-11-23 18:45:52 5185 1

原创 写给妹妹的编程札记 2 - 穷举: 初识剪枝

在上次的文章《穷举 - 从循环到递归》中, 介绍了从直接的循环到搜索的穷举实现。 稍有经验的程序员都能看到上文中的八皇后问题效率大大的低, 有很多改进空间。        从上图很容易看到, 我们穷举所有情况, 然后再一一判断是否是合法的八皇后解。 总共需要穷举8^8 = 16777216个情况。 实际结果, 我们已经知道,只有92个合法的解。很容易, 我们会有一个想法: 能不能早

2013-11-16 22:00:10 1903

原创 写给妹妹的编程札记 1 - 穷举: 从循环到递归

编程(Programming)的含义可能很大, 在此我们局限于使用计算机编写程序解决问题。 要说计算机, 最重要的优点就是“非常听话”, 只要你能够通过她能够理解的语言(编程语言)给出你的指示, 她就会任劳任怨地执行, 不管多么的机械枯燥。换句话说, 计算机相比人,尤其适合干机械的事情。        比如, 求 1 + 2 + 3 + ... + 100         假如没有

2013-11-14 08:28:28 1756

原创 写给妹妹的编程札记

家有小妹, 在我这大哥的潜移默化影响下,误入“歧途”,成了一名程序媛。又因非专业出身, 基础多有欠缺, 平常偶有讨论问题,限于电话描述不清,或讨论不够系统,效果也不见好。 故, 萌生编写《写给妹妹的编程札记》的念头, 把平常讨论的一些东西记录下来。        谨以此文作为引子, 和将来博文的索引。        1. 穷举        2. 穷举 - 简单的剪枝

2013-11-12 23:27:30 895

原创 明天太阳照常升起的概率是多少?

最近在阅读拉普拉斯的《关于概率的哲学笔记》,在第三章“概率计算的一般原则”最后提到一个日出问题:如果我们不了解太阳运行的基本规则,根据统计,在过去的N天里,太阳每天都正常升起。那么,太阳明天照常升起的概率是多少呢?拉普拉斯在书中,指出蒲丰在著作《政治算术》中的结果 1 - (1/2) ^ N 是错误的。 正确的结果应该是 (N + 1) / (N + 2)我

2013-11-08 00:24:22 6794 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除