面筋~

最近班里很多同学在找实习,分享一下我经验~~大家放松心态,后来了解到我工作的内容跟以前学的东东完全不搭边~可见面试官重在看你的学习能力和基础。   面试岗位:阿里云+ 算法工程师 面试内容:算法 + 项目。PS:语言基础之类就不提了~ 1、算法:机器学习系类(这个大家在看书的同时应该扩...

2015-03-11 14:41:32

阅读数 421

评论数 1

第一章 LINUX 常用命令

Linux 常用命令 1.    Linux常用命令 $是普通用户 #是root用户 用户切换到root  su – 退出root 用户     exit Ctrl + c 停止当前命令 Un tab tab 给出以un开头的所有命令    !+ 字符 执行以这个字符开头的历...

2014-07-07 20:55:53

阅读数 362

评论数 0

决策树C4.5

机器学习算法---- 决策树C4.5 C4.5是ID3的改进,中用信息增益选择属性时偏向于选择分枝比较多的属性值,即取值多的属性,在C4.5中由于除以了 ,可以削弱这种作用。 C4.5是如何处理连续属性的呢?实际上它先把连续属性转换为离散属性再进行处理。虽然本质上属性的取值是连续的,但对...

2014-04-21 12:39:12

阅读数 497

评论数 0

梅氏砝码(2014腾讯实习笔试附加题)

原题大意:用4个砝码称出重量在1到40克内的钻石,这4个砝码分别多重(钻石重量为整型)。 解法:梅氏砝码。 假设第i个砝码的重量为a[i]且a[i]>=a[i-1]。i-1个砝码可以表示[1,n](n1,n]U[a[i]-n,a[i]+n]。为使其连续,所以a[i]-na[1]+a[2]...

2014-04-21 12:20:02

阅读数 523

评论数 0

死锁及银行家算法介绍

死锁及银行家算法介绍 1、死锁的四个必要条件: a)      mutual exclusion b)      hold and wait c)      preemption d)      circular wait 2、避免:circular wait a)      Pri...

2014-03-10 21:41:54

阅读数 393

评论数 0

TCP 与 UDP的区别 java

The difference between TCP/IP and UDPCitation:=http://xuxd32.blog.163.com/blog/static/4812193320114885118923/Java主要关注传输层, 在传输层TCP,UDP是两种传输数据流的方式。一、TC...

2014-03-10 21:33:43

阅读数 1388

评论数 0

Java 数据库编程之mysql

Java 数据库编程之mysql 一、基本知识 1、  JDBC 提供了与平台无关的执行sql的API 2、  JDBC操作步骤 a.加载数据库驱动程序,将开发包的地址加载classpath中 b.建立连接 c.使用语句进行数据库操作。 d.关闭数据库 二、mysql中建立连接和关闭连接的功能类 ...

2014-02-18 21:19:17

阅读数 754

评论数 0

聚类算法之层次聚类(Java实现)

聚类算法之层次聚类(Java实现)  资源出处:    http://www.cnblogs.com/emanlee/archive/2012/02/28/2371273.html                       http://blog.csdn.net/jwh_bupt/...

2014-01-05 14:57:26

阅读数 5236

评论数 1

聚类算法之Kmeans (Java实现)

聚类算法之Kmeans (Java实现) 资源出处:http://blog.csdn.net/qll125596718/article/details/8243404                     http://www.cnblogs.com/zhangchaoyang/arti...

2014-01-04 21:59:53

阅读数 1381

评论数 0

聚类算法之DBScan(Java实现)

聚类算法之DBScan 资源出处:http://www.cnblogs.com/zhangchaoyang/articles/2182748.html 一、知识点:DBScan是一种基于密度的聚类算法,有两个参数: 扫描半径 (eps)和最小包含点数(minPts)。它有一个核心点的概念:如果一...

2014-01-04 15:58:17

阅读数 1081

评论数 1

信息熵,信息量

信息量是指从N个相等可能事件中选出一个事件所需要的信息度量或含量,也就是在辩识N个事件中特定的一个事件的过程中所需要提问"是或否"的最少次数.         信息量=不确定性的多少。         信息熵即对信息量的度量,单位比特。         计算公式    ...

2014-01-04 15:31:01

阅读数 436

评论数 0

聚类算法总结

聚类算法总结: --------------------------------------------------------- 聚类算法的种类: 基于划分聚类算法(partition clustering) k-means: 是一种典型的划分聚类算法,它用一个聚类...

2014-01-04 15:26:56

阅读数 599

评论数 0

将关系型数据库中的数据转成RDF(一)

有两种方式,1、使用D2R工具生成虚拟RDF文件显示, 详细实现细节点击打开链接                           2、使用Jena API自己构建三元组模型生成真实的RDF文件。                                 Jena SPI构建RDF模型 ...

2013-10-06 16:40:48

阅读数 1409

评论数 0

RDF简介RDF

一、什么是 RDF?        RDF(Resource Description Framework), 一种用于描述Web资源的标记语言。RDF是一个处理元数据的XML应用,所谓元数据,就是“描述数据的数据”或者“描述信息的信息”。如:书的内容是书的数据,而作者的名字、出版社的地址或版权信...

2013-09-18 20:54:23

阅读数 615

评论数 0

几种压缩算法原理介绍

几种压缩算法原理介绍 RLE RLE 又叫 Run Length Encoding ,是一个针对无损压缩的非常简单的算法。它用重复字节和重复的次数来简单描述来代替重复的字节。尽管简单并且对于通常的压缩非常低效,但它有的时候却非常有用(例如, JPEG 就使用它)。 1.1. 原理 图 2.1 显示...

2013-09-10 10:24:57

阅读数 460

评论数 0

htmlparser的用法

需要做一个垂直搜索引擎,比较了nekohtml和htmlparser 的功能,尽管nekohtml在容错性、性能等方面的口碑好像比htmlparser好(htmlunit也用的是nekohtml),但感觉 nekohtml的测试用例和文档都比htmlparser都少,而且htmlparser基本上...

2013-08-30 21:21:16

阅读数 501

评论数 0

HTML 中 META tag 的作用

meta是用来在HTML文档中模拟HTTP协议的响应头报文。meta 标签用于网页的与中,meta 标签的用处很多。meta 的属性有两种:name和http-equiv。name属性主要用于描述网页,对应于content(网页内容),以便于搜索引擎机器人查找、分类(目前几乎所有的搜索引擎都使用网...

2013-08-30 20:57:49

阅读数 411

评论数 0

基于Berkeley DB实现的持久化队列

队列很常见,但大部分的队列是将数据放入到内存.如果数据过多,就有内存溢出危险,而且长久占据着内存,也会影响性能.比如爬虫,将要抓取的URL放到内存,而URL过多,内存肯定要爆.在读Heritrix源码中,发现Heritrix是基于Bdb实现了一个持久化队列,于是我就将这块代码独立出来,平时使用也蛮...

2013-06-03 09:36:58

阅读数 583

评论数 0

MD5加密,并转换为16进制

背景:在做爬虫的URL处理专题中需要对URL进行处理再存储。 要求: Java 中对数据进行MD5加密,并转换为16进制,以字符串的形式输出 (1)      在Java中,java的java.security.MessageDigest已经定义了MD5的计算,得到的结果是128位整数。 ...

2013-06-02 12:54:04

阅读数 2251

评论数 0

谷歌面试题:给定能随机生成整数1到5的函数,写出能随机生成整数1到7的函数

给定能随机生成整数1到5的函数,写出能随机生成整数1到7的函数。 我的想法: 编写一个生成0和1的随机函数: rand_01() step1. 调用给定的随机函数original_rand()生成一个数  如果==3 goto step1  如果 如果>3 return ...

2013-05-22 08:55:14

阅读数 456

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭