李博Garvin的专栏

阿里云机器学习PD

【LeetCode从零单排】No.135Candy(双向动态规划)

1.题目There are N children standing in a line. Each child is assigned a rating value.You are giving candies to these children subjected to the followin...

2015-07-29 15:14:51

阅读数:1694

评论数:1

机器学习常见算法分类汇总

机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文为您总结一下常见的机器学习算法,以供您在工作和学习中参考。机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一...

2015-07-24 09:12:16

阅读数:1873

评论数:0

大型文件去重

1.背景面试的时候经常会被问到一个问题,大型的文件该如何去重。写一个python脚本是效率很差的策略。这里讲下如何用shell实现。2.流程(1)文件切割用split函数对于文件切割。split -l 10000 test.txt-l是按照行切割,10000是每10000行切割成一份文件。切割完会...

2015-07-23 14:04:17

阅读数:2542

评论数:0

【分布式计算】DFS && BigTable

1.背景分布式计算的发迹应该是google在2003年发表的三篇paper,分别是GFS、MapReduce、BigTable。其中MapReduce大家都很熟悉了,不懂的同学也可以看看我之前写的文章【分布式计算】MapReduce的替代者-Parameter Server为什么google会搞分...

2015-07-22 17:47:55

阅读数:1713

评论数:0

unittest单元测试

1.背景 到了公司发现,ut(单元测试)是非常重要的一部分,ut并不是完全是测试的同学完成,很多时候ut是需要开发的同学自己来做。研究了下python脚本下unittest包的用法。使用的时候要import unittest包,函数的传入参数unittest.TestCase,主要结构包括:set...

2015-07-21 14:46:09

阅读数:1948

评论数:0

面试题总结~~(google level)

题目一Trapping Rain WaterGiven n non-negative integers representing an elevation map where the width of each bar is 1, compute how much water it is able...

2015-07-17 16:49:05

阅读数:1514

评论数:0

29个你必须知道的Linux命令

虽然Linux发行版支持各种各样的饿GUI(graphical user interfaces),但在某些情况下,Linux的命令行接口(bash)仍然是简单快速的。Bash和 Linux Shell 需要输入命令来完成任务,因而被称为 命令行 接口。命令是计算机执行任务的指令。可以使用命令去关闭...

2015-07-15 16:09:13

阅读数:1225

评论数:0

【LeetCode从零单排】No198.House Robber &&No91.Decode Ways&&139 word break(动态规划典型应用)

1.题目一道典型的Dynamic Programming的题目。You are a professional robber planning to rob houses along a street. Each house has a certain amount of money stashed...

2015-07-15 15:46:20

阅读数:1286

评论数:0

【LeetCode从零单排】No22.Generate Parentheses

题目Given n pairs of parentheses, write a function to generate all combinations of well-formed parentheses.For example, given n = 3, a solution set is:...

2015-07-14 12:01:34

阅读数:1161

评论数:0

【分布式计算】MapReduce的替代者-Parameter Server

首先还是要声明一下,这个文章是我在入职阿里云1个月以来,对于分布式计算的一点肤浅的认识,可能有些地方不够妥善,还请看官可以指出不足的地方,共同进步。一.背景随着互联网的发展,数据量的增大,很多对于数据的处理工作(例如一些推荐系统、广告推送等)都迁移到了云端,也就是分布式计算系统上。衍生了很多牛逼的...

2015-07-13 09:48:46

阅读数:11511

评论数:4

google的面试要求(自己的标杆)

http://sites.google.com/site/steveyegge2/five-essential-phone-screen-questionse Five Essential Phone-Screen Questions Stevey's Drunken Blog Rants™I'v...

2015-07-09 15:42:08

阅读数:2315

评论数:0

【LeetCode从零单排】No221.Maximal Square

题目Given a 2D binary matrix filled with 0's and 1's, find the largest square containing all 1's and return its area.For example, given the following m...

2015-07-02 09:58:17

阅读数:1471

评论数:0

提示
确定要删除当前文章?
取消 删除