- 博客(17)
- 收藏
- 关注
原创 Page Rank介绍
Page Rank要点:1)将这个web看做一张大网(有向图),一个网页代表一个节点, 有向边表示一个网页到另一个网页的链接;2)一个网页的重要性由链接到该网页的数量和质量(重要性)决定;一个网页分给另一网页的重要性多少为 该网页的重要性除以该网页的链接总数,3)邻接矩阵--》推移概率矩阵(前一个矩阵转置,再对列归一化)--》求最大特征值对应的特征向量,再对该向量归一化,得到的向量
2012-02-27 22:13:42
1168
原创 数据挖掘(自己总结的,缺少不少图片)
前言 做实际应用时,领域知识非常重要, 方法也重要对于一个应用或研究,多个模型结合到一起往往效果更好,同时,一个方法的应用也不是单一, 一个方法有多种用途,可以单独解决几类问题,也可以作为一个步骤辅助其他方法解决其他类问题, 总之, 思维灵活非常重要以下可以参加 > Han Jiawei, > 课件, 亦可以参考网络资料OLAP,数据仓库,星形模型,雪花模型等KDD的过程1 频
2012-02-27 14:33:08
1179
原创 数学之美系列(吴军 Google研究员)
看了吴军(http://www.cs.jhu.edu/~junwu/)的数学之美系列, 有些收获。 数学理论之博大精深,需要细细体会,数学的实际应用,更需探索和发掘;学以致用啊。其中的 贝叶斯、最大熵模型、SVD、布尔代数、布隆过滤器、相关历史等感觉非常有意思,可惜最大熵模型、SVD没怎么看懂。发现Google黑板报有些文章不错, 吴军还有 “浪潮之巅” 有时间好好看看。相关链接数学之
2012-02-27 14:28:02
1093
原创 (POJ 1002) 487-3279
DescriptionBusinesses like to have memorable telephone numbers. One way to make a telephone number memorable is to have it spell a memorable word or phrase. For example, you can call the Universit
2012-02-15 19:00:14
947
原创 《POJ 1001》 Exponentiation
DescriptionProblems involving the computation of exact values of very large magnitude and precision are common. For example, the computation of the national debt is a taxing experience for many comp
2012-02-14 11:30:07
332
转载 CDN技术介绍
背景Internet的高速发展,给人们的工作和生活带来了极大的便利,对Internet的服务品质和访问速度要求越来越 高,虽然带宽不断增加,用户数量也在不断增加,受Web服务器的负荷和传输距离等因数的影响,响应速度慢还是经常抱怨和困扰。解决方案就是在网络传输上利 用缓存技术使得Web服务数据流能就近访问,是优化网络数据传输非常有效的技术,从而获得高速的体验和品质保 证。网络缓存技术
2012-02-13 20:24:35
343
转载 你刚才在淘宝上买了一件东西【技术普及贴】
你发现快要过年了,于是想给你的女朋友买一件毛衣,你打开了www.taobao.com。这时你的浏览器首先查询DNS服务器,将www.taobao.com转换成ip地址。不过首先你会发现,你在不同的地区或者不同的网络(电信、联通、移动)的情况下,转换后的ip地址很可能是不一样的,这首先涉及到负载均衡的第一步,通过DNS解析域名时将你的访问分配到不同的入口,同时尽可能保证你所访问的入口是所有入口中可能
2012-02-13 16:17:22
337
原创 对网络购物的思考
越来越感慨网络购物的迅猛发展,网购网站不断涌现、网店数目日益增多、物流公司经常爆仓、学校快递服务中心的出现……无不昭示这一领域的巨大的市场蛋糕,好甜。网购为甚么这么火呢?我认为:1. 方便。足不出户、无论天气如何,直接网购省时省力省去砍价的烦恼……2. 便宜。 商家不用租房税赋轻销量大减少其成本,商品自然便宜, 竞争又激烈,商品自然更便宜3 质量不差。 大多数商家都想吸引回头客、长期
2012-02-10 15:56:17
608
原创 创业想法--情侣礼物商店
今天在网上给女朋友选情人节礼物,想要有新意又要有意义,真是煞费心思呀。每年都要给女朋友买几次礼物,每次又要不一样, 难免有些江郎才尽, 淘宝的礼物很多都一样, 看起来费时费力, 直接google搜,搜到的都是一些网络小店, 要是有专门的为情侣提供礼物信息的网站就好啦。所谓因为专业所以精彩, 淘宝虽大,但不够细, 垂直类的网站目的性明确、较为专业, 或许专门针对情侣礼物(将来可以扩展到情
2012-02-09 22:33:38
1001
转载 IMDB评分标准
IMDB是美国一个权威的电影网站,除了详尽的资料外,一个特色是上面给影片做了评分。这些分数根据复杂的规则得出,不光有专业工作人员对影片打分,也允许普通影迷给电影评分,当投票人数较多的时候,我们可以认为,影片的得分可以比较客观地反映影片的质量。当然由于他是一个英文网站,这也使得非英语影片受到的关注较少。 上图截至是2007-7-20时,IMDB上对《料理鼠王》评分的所有打分者的条状
2012-02-09 21:45:48
1861
原创 《程序员的自我修养》总结(二)
四。动态链接 1.why: 节约内存和磁盘空间、程序开发发布和更新2.efl的dso的地址无关代码pic,通过got段间接实现 3.动态链接可以延迟绑定 4.动态符号表、动态重定位表 5.dll是地址有关的,加载时可能需要rebasing五。栈与调用惯例
2011-08-27 23:27:23
263
原创 《程序员的自我修养》总结(一)
一. 计算机领域 1.计算机科学领域的任何问题都可以通过增加一个间接的中间层来解决。(dso的pic通过got表来实现,vmware虚拟机,java的跨平台等等) 2.计算机硬件为os提出接口,供os使用;os为应用程序提供api,让其使用os实现的功能;....
2011-08-27 23:15:12
383
转载 linux2.4线程实现机制分析
一.基础知识:线程和进程按照教科书上的定义,进程是资源管理的最小单位,线程是程序执行的最小单位。在操作系统设计上,从进程演化出线程,最主要的目的就是更好的支持SMP以及减小(进程/线程)上下文切换开销。无论按照怎样的分法,一个进程至少需要一个线程作为它的指令执行体
2011-08-27 21:58:44
376
原创 面试题-- 求较小的值,不能用 比较运算符 if-else ?: while for 内嵌汇编 递归 第三方函数
题目: 求较小的值,不能用 比较运算符 if-else ?: while for 内嵌汇编 递归 第三方函数 int Min(int a, int b) { //write code here } 解法(来自网络):int Min(int a, i
2011-08-17 19:11:21
384
转载 深入浅出大端和小端
端模式(Endian)的这个词出自Jonathan Swift书写的《格列佛游记》。这本书根据将鸡蛋敲开的方法不同将所有的人分为两类,从圆头开始将鸡蛋敲开的人被归为Big Endian,从尖头开始将鸡蛋敲开的人被归为Littile Endian。小人国的内战就源于吃鸡蛋时是究竟从
2011-08-11 19:41:25
349
转载 在VC中编译、运行程序的小知识点
1、Run-Time LibraryRun-Time Library是编译器提供的标准库,提供一些基本的库函数和系统调用。我们一般使用的Run-Time Library是C Run-Time Libraries。当然也有Standard C++ libraries。
2011-08-10 22:38:15
289
转载 编译/连接/静态符号表杂谈1
许多Visual C++的使用者都碰到过LNK2005:symbol already defined和LNK1169:one or more multiply defined symbols found这样的链接错误,而且通常是在使用第三方库时遇到的。对于这个问题,有的朋友可能不
2011-08-10 22:24:27
1909
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人