- 博客(57)
- 资源 (2)
- 收藏
- 关注
原创 leetcode --Power of Two
判断一个数是否是2的次方;思路:2的次方是1, 2, 4, 8, 16, 32 *其对应的二进制是1, 10, 100, 1000, 10000, 10000 *隐藏条件:2的次方肯定大于0又因为输入是整数,因此可以排除结果是负数的情况;class Solution {public: bool isPowerOfTwo(int n) {
2015-07-07 21:07:28 578
原创 leetcode Subsets
思路1:(1)首先对元素进行排序;(2)按层次减少元素,每一层减少一个元素;比如刚开始是[1, 2, 3]然后在第一层分别减少一个元素时1, 2, 3 则结果是[2,3 ], [1, 3], [1, 2]依次执行,直到该层列表元素个数为0.class Solution{public: vector> subsets(vector& nums) {
2015-06-05 18:21:28 441
原创 leetcode Maximum Depth of Binary Tree
解题思路:深度优先遍历二叉树,先遍历左孩子,一直到叶子节点,然后回溯,用栈来回溯,遍历右孩子。用栈表示哪些节点有被访问过。/** * Definition for a binary tree node. * struct TreeNode { * int val; * TreeNode *left; * TreeNode *right; *
2015-06-04 17:40:22 538
原创 Search a 2D Matrix
原题:class Solution {public: bool searchMatrix(vector>& matrix, int target) { int m=matrix.size(); int n=matrix[0].size(); int i=m; for(i=m-1;i>=0;i--){
2015-06-01 21:19:36 431
原创 leetcode Find Minimum in Rotated Sorted Array
原题:复杂度为O(n)的算法:class Solution {public: int findMin(vector& nums) { int min=2^31-1; for(int i=0; i<nums.size(); i++){ if(nums[i]<min) min=nums[i
2015-06-01 20:55:05 359
转载 深入理解Hadoop集群和网络
深入理解Hadoop集群和网络2012-11-08 14:47 Brad Hedlund csdn 字号:T | T本文将着重于讨论Hadoop集群的体系结构和方法,及它如何与网络和服务器基础设施的关系。最开始我们先学习一下Hadoop集群运作的基础原理。AD:WOT2015 互联网运维与开发者大会 热销抢票云计算和Hadoo
2015-02-14 15:56:23 414
转载 HashMap的工作原理
原文链接:http://www.importnew.com/7099.html#comment-291430本文由 ImportNew - 唐小娟 翻译自 Javarevisited。欢迎加入翻译小组。转载请见文末要求。HashMap的工作原理是近年来常见的Java面试题。几乎每个Java程序员都知道HashMap,都知道哪里要用HashMap,知道
2015-01-29 14:07:47 331
转载 HashMap和Hashtable的区别
原文链接:http://www.importnew.com/7010.html本文由 ImportNew - 唐小娟 翻译自 Javarevisited。欢迎加入翻译小组。转载请见文末要求。HashMap和Hashtable的比较是Java面试中的常见问题,用来考验程序员是否能够正确使用集合类以及是否可以随机应变使用多种思路解决问题。HashMap的
2015-01-29 13:43:34 329
转载 Java中守护线程的总结
在Java中有两类线程:User Thread(用户线程)、Daemon Thread(守护线程) 用个比较通俗的比如,任何一个守护线程都是整个JVM中所有非守护线程的保姆:只要当前JVM实例中尚存在任何一个非守护线程没有结束,守护线程就全部工作;只有当最后一个非守护线程结束时,守护线程随着JVM一同结束工作。Daemon的作用是为其他线程的运行提供便利服务,守护线程最典型的应
2015-01-23 22:10:20 501
原创 KDD 2014 “A Dirichlet Multinomial Mixture Model-based Approach for Short Text Clustering” 的主要思想
这几天在做短文本主题发现时,考虑使用聚类算法不同一主题的文本聚集到一块,因此读了这篇论文:A Dirichlet Multinomial Mixture Model-based Approach for Short Text Clustering在该文中,作者使用“a collapsed Gibbs Sampling algorithm for the Dirichlet Multinom
2015-01-15 10:39:20 3222
转载 IBM面试记
原文链接:http://blogread.cn/it/article/4126?f=sa话说其实我很久没有被正经面试过了。一开始去微软实习自然经过了经典的笔试和几轮面试,然后去了朋友的创业公司并立即被激动集团收编――没有面试,接着从激动集团去合伙创业――没有面试,然后被朋友推荐去盛大创新院――面试更像是讨论及聊天。由于长久缺乏职场磨练,我虽然对自己能力有一定信心,但也怀
2015-01-14 15:20:02 437
转载 面试IT业界顶尖企业所应该知道的10道题(1)
题目: 现有一个包含一千万个单词的文本文件, 每个单词占一行, 每行小于1K字节. 要求找出出现次数最多的10个单词. 如果要从一千个这样的文件中找出出现次数最多的10个单词(所有单词加起来去重后不超过一千万个), 你会怎么设计? 难度: 10K 领域: 编码, 架构, 分布式*** 解析 *** 这道题没有任何算法上的难度, 最简单的思路就是,
2015-01-14 15:18:20 397
转载 大数据面试笔试
原文链接:http://blogread.cn/it/article/2455?f=sa大数据量的问题是很多面试笔试中经常出现的问题,比如baidu google 腾讯 这样的一些涉及到海量数据的公司经常会问到。 下面的方法是我对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一
2015-01-14 15:16:29 760
原创 LIBSVM在python下的接口调用
首先从官网下载软件:http://www.csie.ntu.edu.tw/~cjlin/libsvm/index.html?js=1#svm-toy-js解压后取其中的python包.我把该包放到了路径D:\Python27\Lib然后需要在python搜索路径下加入该模块的绝对路径:在Python Shell下执行以下命令:import sys可以先查看一下现
2015-01-05 15:04:37 597
原创 中文分词的一些最新研究进展
最近,读了几篇这两年发表的关于分词的会议论文,发现现在主要的研究方向是解决分词的领域适用问题,采用的主要模型是已有的分词算法+训练集+部分标记语料的半监督学习方式,分词算法包括感知器、条件随机场,部分标记的语料主要为维基百科的汉语语料http://dumps.wikimedia.org/backup-index.html。现在主要介绍一下各文章的关注重点和异同。因为水平问题或对论文本身的理解问
2015-01-02 15:18:06 2042
转载 LDA模型学习(代码)
原文链接:http://blog.csdn.net/zhoubl668/article/details/8365710为了把LDA算法用于文本聚类,我真的是绞尽脑汁。除了去看让我头大的概率论、随机过程、高数这些基础的数学知识,还到网上找已经实现的源代码。 最先让我看到署光的是Mall
2014-12-26 08:55:04 788
转载 LdaGibbsSampler.java lda代码
原文链接:http://blog.csdn.net/zhoubl668/article/details/8959940/* * (C) Copyright 2005, Gregor Heinrich (gregor :: arbylon : net) (This file is * part of the org.knowceans ex
2014-12-26 08:53:59 609
转载 2013.9月,百度电话面试经验
原文链接:http://blog.csdn.net/aspnet_lyc/article/details/122339799月在百度官网投了几份简历,申请实习生,简历分为中文简历和英文简历两种,本人较懒,只投了份中文简历,英文简历还没写,应该及时补上。大约一周之后,hr通知我要面试,我说我不在北京,于是hr说会安排电话面试。电话面试一面主要是聊天
2014-12-26 08:48:52 472
转载 Google 2013年最具影响力的技术论文
原文链接:http://blog.csdn.net/zhoubl668/article/details/38584931来自Google官方博客,为省却大家找梯子之苦,全文转贴在此。我会逐渐翻译出来。2013年最具影响力论文by Corinna Cortes and Alfred Spector, Google R
2014-12-26 08:47:25 1130
转载 建议的程序员学习LDA算法的步骤
原文链接:http://blog.csdn.net/zhoubl668/article/details/8959467一开始直接就下了Blei的原始的那篇论文来看,但是看了个开头就被Dirichlet分布和几个数学公式打倒,然后因为专心在写项目中的具体的代码,也就先放下了。但是因为发现完全忘记了本科学的概率和统计的内容,只好回头去
2014-12-26 08:43:59 1610
转载 lda代码的一些资料
原文链接:点击打开链接首先,我以前总结过,关于北邮一个人写的导读,连接在这里。肯定得看Blei 2003年的论文,点击下载。然后很重要的Blei的视频和一个80多页的Lecture。Topic ModelsLatent Dirichlet Allocation(LDA) [pdf]模型是近年来提出的一种具有
2014-12-26 08:40:18 622
转载 如何准备机器学习工程师的面试
原文链接:http://www.zhihu.com/question/23259302如何准备机器学习工程师的面试 ?修改我之前面试一些公司的机器学习或者数据挖掘工程师的职位。感觉自己准备的不够充分。想了解下一般会问哪些问题,考察哪些方面的东西。修改举报4 条评论 分享 • 邀请回答按票数排序按
2014-12-22 19:22:37 1652
转载 微软101道经典面试题
原文链接:http://blog.csdn.net/zzwu/article/details/1244905微软101道经典面试题 Algorithms and Programming1. Given a rectangular (cuboidal for the puritans) cake with a rectangular piece
2014-12-21 20:16:14 1026
转载 机器学习的数学基础(1)--Dirichlet分布
原文链接:http://blog.csdn.net/jwh_bupt/article/details/8841644这一系列(机器学习的数学基础)主要包括目前学习过程中回过头复习的基础数学知识的总结。基础知识:conjugate priors共轭先验 共轭先验是指这样一种概率密度:它使得后验概率的密度函数
2014-12-21 20:10:33 439
转载 聚类(1)——混合高斯模型 Gaussian Mixture Model
原文链接:http://blog.csdn.net/jwh_bupt/article/details/7663885聚类系列:聚类(序)----监督学习与无监督学习聚类(1)----混合高斯模型 Gaussian Mixture Model 聚类(2)----层次聚类
2014-12-21 19:48:05 673
转载 漫谈:机器学习中距离和相似性度量方法
原文链接:http://www.cnblogs.com/daniel-D/p/3244718.html在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如 K 最近邻(KNN)和 K 均值(K-Means)等等。根据数据特性的不同,可以采用不同的度量方法。一般
2014-12-20 21:58:01 346
转载 机器学习经典算法详解及Python实现–K近邻(KNN)算法
原文链接:http://dataunion.org/?p=4237作者:suipingsp(一)KNN依然是一种监督学习算法KNN(K Nearest Neighbors,K近邻 )算法是机器学习所有算法中理论最简单,最好理解的。KNN是一种基于实例的学习,通过计算新数据与训练数据特征值之间的距离,然后选取K(K>=1)个距离最近的邻
2014-12-19 15:03:33 782
转载 基于机器学习方法的POI品类推荐算法
原文链接:http://dataunion.org/?p=4211作者:wangbogong前言在美团商家数据中心(MDC),有超过100w的已校准审核的POI数据(我们一般将商家标示为POI,POI基础信息包括:门店名称、品类、电话、地址、坐标等)。如何使用这些已校准的POI数据,挖掘出有价值的信息,本文进行
2014-12-19 15:02:23 1069
转载 推荐!国外程序员整理的机器学习资源大全
原文链接:http://dataunion.org/?p=3560英文原文:awesome-machine-learning本文汇编了一些机器学习领域的框架、库以及软件(按编程语言排序)。C++计算机视觉CCV —基于C语言/提供缓存/核心的机器视觉库,新颖的机器视觉库OpenCV—
2014-12-19 14:59:42 785
转载 scrapy模拟登录新浪微博
原文链接:http://flychen.sinaapp.com/article/scrapy-analog-logged-sina-microblogging.html这个文章还没试,所以不知道文中的方法对现在的微博登陆系统是否还有效,先记录在此。hi: all, scrapy搞模拟登录真的很简单
2014-12-18 18:47:35 1193
转载 新浪微博模拟登录 java实现
原文链接:http://yuncode.net/code/c_542f981eec3be26package com.shiyimm.crawler.weibo;import java.io.FileNotFoundException;import java.io.FileReader;import ja
2014-12-18 16:45:33 895
转载 Python模拟新浪微博登录
原文链接:http://blog.javachen.com/2014/03/18/simulate-weibo-login-in-python/看到一篇Python模拟新浪微博登录的文章,想熟悉一下其中实现方式,并且顺便掌握python相关知识点。代码下面的代码是来自上面这篇文章,并稍作修改添加了一
2014-12-18 16:43:22 664
转载 微博推荐引擎体系结构简述
原文链接:http://www.wbrecom.com/?p=48这里有个“道术孰优”的问题,何为“道”?何为“术”?举个例子的话,《孙子兵法》是道,而《三十六计》则为术。“道”所述,是宏观的、原理性的、长久不变的基本原理,而“术”则是在遵循基本原理基础上的具体手段和措施,具有易变性。技术也是如此,算法本省的细节是“术”,算法
2014-12-18 09:16:06 567
转载 微博推荐算法简述
原文链接:http://www.wbrecom.com/?p=80 “We are leaving the age of information and entering the age of recommendation” — Chris Anderson in The Long Ta
2014-12-18 09:14:14 1710
转载 主题模型LDA及其在微博推荐&广告算法中的应用--第1期
因为原文偶尔会出现访问不了的情况,所以特拷贝于此。原文链接:http://www.wbrecom.com/?p=136 @吴宇WB 【前言】
2014-12-18 09:10:40 4780
转载 Java模式(适配器模式)
原文链接:http://blog.csdn.net/elegant_shadow/article/details/5006175今天看了下Java中的适配器模式,以下就来小做下总结和谈谈感想,以便日后使用。 首先,先来先讲讲适配器。适配就是由“源”到“目标”的适配,而当中链接两者的关系就是适配器。它负责
2014-12-17 19:59:18 363
转载 数据挖掘之大数据流处理
原文链接:http://blog.csdn.net/viewcode/article/details/9088467目录(?)[+]大数据流 即 实时收集的大量的数据。数据的流量大到无法实时将全部数据放入分析工具中处理。这里写写要解决的问题,及问题解决的思路,若是真的去实现,则需要考虑更
2014-12-14 10:34:40 893
转载 Python爬虫框架Scrapy实战之定向批量获取职位招聘信息
原文链接:http://blog.csdn.net/HanTangSongMing/article/details/24454453所谓网络爬虫,就是一个在网上到处或定向抓取数据的程序,当然,这种说法不够专业,更专业的描述就是,抓取特定网站网页的HTML数据。不过由于一个网站的网页很多,而我们又不可能事先知道所有网页的UR
2014-12-11 16:08:22 337
转载 机器学习和相关领域的博客
原文链接:http://www.cs.waikato.ac.nz/~bernhard/good-machine-learning-blogs.htmlMachine Learning and related area blogsYour launch pad for meaningful "idle time" activity :-) Enjo
2014-12-10 09:07:07 412
转载 LDA
原文链接:http://yinwenpeng1987.blog.163.com/blog/static/162471582201121210828165/____http://sy95122.blog.163.com/blog/static/3601615920101024111530459/ 关键所在:it posits that ea
2014-12-10 08:47:28 523
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人