- [相关度, 搜索技术] 关键词与关键词之间的相关度计算 >>
假设一个文章集合 {C},总文章数目为N,其中含有单词X的文章总数为Nx,含有单词Y的文章总数是Ny,含有{X+Y}的文章总数是 Nxy,那么相关性这么计算Corr(X,Y)= Math.log10(N/Nx)*Math.log10(N/Ny)*Nxy/(Nx+Ny-Nxy) - [digg] 国外同行关注啥——digg.com网站Programming分类每周热点[11/26 - 12/02] >>
相比我们都听过digg.com的大名,这个网站正是Web 2.0所倡导的“每个人都能贡献”的绝佳实践,其中的Programming分类则自然成为了程序设计领域中的风向标。从这个分类的文章中,我们完全可以看一些出国外业界的趋势,当然最多的还是国外开发者所关注的东西,毕竟其中的排行就是众多用户参与、选择的直接结果。 - [.NET开发, ajax] 文章推荐:ASP.NET AJAX Under the Hood Secrets及其他 >>
这片文章主要关注于ASP.NET AJAX中经常会使用到,却不太被人关注的一些功能细节,以及需要避免的一些问题。例如“Batch calls are not always faster”等,也提到了浏览器的一些特性以及限制,例如“Browsers do not respond when more than two calls are in queue”,可以说这些都是开发ASP.NET AJAX乃至Web开发所必需了解的内容。文章中也提到了一些ASP.NET AJAX在使用时的一些技巧,例如在Web Service访问时利用Cache来提高效率,而且这可不是像之前CTP的官方文档上提到的简单方法那样“普通”,它是个真正经过挖掘与实践之后得到的结论。其余部分的也提到了客户端Function.createDelegate方法的使用(这个方法我一直很喜欢,呵呵),以及在访问Web Services时HTTP GET与HTTP POST直接的对比。 - [.NET开发, ajax] ASP.NET AJAX under the hood secrets >>
Microsoft recently released Beta 2 of ASP.NET AJAX. Although it's a very powerful framework, when you will build a real AJAX site like those out there in the Web 2.0 world, you will face many problems that you will hardly find documented anywhere. In this article, I will show some advance level ideas that I learned while building Pageflakes. We will look at the advantages and disadvantages of Batch calls, AJAX call timeouts, browser call jam problem, ASP.NET 2.0's bug in web service response caching, and so on. - [.NET开发, Cache] 技巧和诀窍:使用ASP.NET 2.0 输出缓存替换的功能实现“甜圈缓存(Donut Caching)” >>
ASP.NET 2.0添加了2个非常重要的改进,使得缓存功能更加完善:1) 对SQL缓存失效的支持 - 这允许你在缓存的页面或数据结构所依赖的数据表或记录行被更新时,使缓存内容自动失效然后重新生成缓存内容。例如,你可以在一个电子商务网站上输出缓存你所有的产品列表网页,然后确信在数据库中的产品价格一旦有所变动,这些网页就会在下一个请求时重新生成,这样就不会向用户显示过期的价格数据了。 2) 输出缓存的替换 - 这个奇妙的特性允许你实现我有时称之为“甜圈缓存(donut caching)” 的功能,在这里,你输出缓存页面上的所有东西,但除了几个包含在缓存区域内的动态区域外。这允许你更积极地实现整页输出缓存,不用为了实现局部页面缓存而把你的页面分成多个.ascx用户文件。下面这个技巧/诀窍指南更好地解释了这个特性的促动因素以及其实现。 - [多核] 免费午餐已经结束——软件历史性地向并发靠拢 >>
如果你以前对并发未加注意,那么现在是时候了,仔细分析应用的设计,挑出现在和不久就可能过于依赖CPU能力的操作,研究这些部分如何从并发得益。你和你的团队,现在也该深入学习和了解并发编程的要求、不足、风格和专业概念了。少部分应用天然适用于并行,但大多数不是的。即便你知道程序受制于CPU的位置,可能也很难找到将这部分操作并行化的办法。所有这些问题,要求我们加快对并行的思考和研究。隐式并行编译器能帮点小忙,但不能指望太多,它不可能比得上尽你所能将顺序化程序转化为显式并行和多线程版本后的效果的。感谢仍未停止的缓存扩大和管线少量优化,免费饭菜在今后还能有一点,不过从今天开始,餐馆无偿提供的只有小菜和饭后小点心了。菜谱上仍然有优质可口的鱼片,但现在要享受它就得付费——设计精细化、代码更复杂,而且要加倍测试。对于多数应用来说,这是个好消息,尽管要辛勤耕耘,但回报是丰厚的,因为并发可以让应用继续从处理器能力暴增中充分受益。 - [SQL_Server] 如何获取SQL Server数据库里表的占用容量大小 >>
- [google, PageRank, 搜索技术] 斯坦福大学找到新方法使Google速度再提高5倍 >>
为了加快PageRank的计算,斯坦福大学的科研人员已经开发了三种基于数字线性代数的技术。第一种被称为BlockRank的技术的效果最显著,将计算PageRank的速度提高了3倍,研究人员发现,大多数网站上80%以上的链接都指向相同的网站。PageRank单独计算每个链接,而BlockRank将所有指向相同网站的链接作为一个整体进行处理。 第二种技术利用了数学上的归纳法。研究人员称,与PageRank的遍历整个网站才能够计算出其归类相比,归纳法的速度提高了50%。 第三种被称为自适应PageRank的技术基于这样的事实,即排名较低的网站的计算速度更快,通过剔除这样的网站,计算的速度能够提高50%。 - [计算机科学] 从突破存储的极限说开去 >>
传统的数据存储,是采用基本的“字节排列”的方法,是一种静态的数据线性排列。而在“彩虹技术”和“铁杵”的例子中,信息数据就已经不再是线性排列的方式——它甚至也不是非线性排列的方式,而是从一个类似“种子(feed)”的物理实体(一张画满几何图案的A4纸或一根有划痕的铁杵)开始,采用某种固定的方法计算(computing)出来的。这种以“种子计算”取代“静态存储”的思路,其实是从数字信息处理到模拟信息处理的一种回归。以0和1为基本单位的数字信息处理,由于其离散的特性,必定会遇到容量上或精度上的限制。而回归基于物理实体的信息演算,则可以突破这个限制,去获得近乎于无穷的可能性。 - [网络技术, 测试] Web Test Tools >>
This tools listing has been loosely organized into the following categories: Load and Performance Test Tools Java Test Tools Link Checkers HTML Validators Free On-the-Web HTML Validators and Link Checkers PERL and C Programs for Validating and Checking Web Functional/Regression Test Tools Web Site Security Test Tools External Site Monitoring Services Web Site Management Tools Log Analysis Tools Other Web Test Tools - [ACT, .NET开发, 开发工具] Microsoft ACT standalone installation >>
Microsoft ACT is great for stress testing web sites. The only 'problem' is that you have to install Visual Studio .NET in order to use it. I use it frequently on my dev machine but some times it is useful have it on a remote machine for stress testing directly in a pre-production environment. The steps below shows how you can copy your local ACT installation to a standalone computer.
CSDN技术网摘生成。更多技术动态,请访问我的技术网摘(RSS)