学术科技
文章平均质量分 86
大胖5566
科学、技术与人文的统一和谐,本人邮箱moodytong@126.com
展开
-
draft-ppsp-download
Downloading Data From The Remote P2P Streaming System draft-tong-ppsp-download-01Abstract This draft has proposed a scheme trying to provide an uniform interface for the client to get the streaming no matter whether the streaming exists in the cli原创 2010-11-16 10:37:00 · 910 阅读 · 0 评论 -
社交标签技术的研究
Survey on Social Tagging Techniques--Manish Gupta, Rui Li, Zhujun Yin and Jiawei Han 这篇文章对标签技术进行了深入的研究,包括tag streams的属性、标签模型、标签语义、基于标签的推荐、标签可视化、标签的应用以及运用标签时存在的问题。1.简介(对tag技术的感性认识)翻译 2011-12-03 09:46:11 · 4812 阅读 · 2 评论 -
k-means简介
将物理或抽象对象的集合组成为由类似的对象组成的多个类的过程被成为聚类。 应用例子:数据挖掘和文本挖掘中对数据的清洗、过滤和分类 k-means 算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算原创 2011-12-20 11:14:45 · 1021 阅读 · 0 评论 -
services的新趋势之一Linked Service
说明:本篇文章基于对论文“Toward the Next Wave of Services: linked services for the web of data”,仅作学习和参考之用。 1.前言 web服务和SOA作为企业应用集成、跨组织商业流程的实施甚至分布式应用开发通用方案提供了强有力的工具,但是非常遗憾的是web服务并没有在web上流行起来,针对此问题,将从web原创 2012-04-20 21:39:07 · 1152 阅读 · 0 评论 -
关于NGSON的一些介绍
1相关背景 随着WWW的进一步发展,互联网上带宽在最近二十年中,基本上都被高速和与视频相关的服务占据,例如YouTube、Bt等。在2010年视频流量就已经超过了非视频流量。而且视频流量将会扩展到更多的智能设备上,例如智能手机、平板电脑、智能电视、物联网中的设备等。为了让目前的IP网络更好、更只能的支持内容分发,加强端到端的质量保证和网络资源的公平利用,十分有必要对ISP的网络进行翻译 2012-04-23 09:47:36 · 1818 阅读 · 0 评论 -
Something about the Sampling of OSNs Data
声明:该文为本人读书笔记,目前国内针对不同sampling对社交网络分析的论文比较少,除了看到清华的那篇USGSD,sampling是社交分析第一步。 In recent years, thepopulation of Online Social Networks (OSNs) has experienced an explosiveincrease. Twitter for exam原创 2012-05-27 18:48:44 · 2195 阅读 · 0 评论 -
国外博士论文下载~
国外的博士论文很多工作系统性强,条理清晰,是科研者很好的参考资料。可是怎么样能够搜索并下载到fulltext,比如如何利用好Google工具来检索呢,大家来讨论下,各抒己见,互相学习,共同进步吧PS:发起话题已经有几天了,大家发言都很中肯,我把各位虫友的意见总结了下,得到了简单的搜索国外硕博士论文的方法,将会继续更新完善......1、利用专业的博士论文数据库如proquest转载 2012-05-14 13:04:12 · 17768 阅读 · 0 评论 -
CDN总结之一
前言:一直想做一个CDN的全面总结,虽然没有做出什么东西,但是要做到知其所以然。辛苦总结,请尊重作者。PDF版本 已经上传http://ishare.iask.sina.com.cn/f/25611471.html-----------------------------------------------------------------------------------------原创 2011-09-15 20:58:53 · 3351 阅读 · 0 评论 -
R的基本使用(1)
R简介 R是一个开源的语言,提供了用来进行统计计算和可视化的软件工具环境。R语言被广泛的用来开发统计软件和数据分析中。R语言来自S,S来自贝尔实验室(1976)。(贝尔好牛) R的下载,去cran官网即可http://cran.r-project.org/ library()可以看到目前安装有哪些包,如果要添加的话,可以到cran官网等网站下载(可以goo原创 2012-10-17 16:47:01 · 3218 阅读 · 0 评论 -
Flickr Tag Recommendation based on Collective Knowledge
本篇论文包含两个方面:通过对Flickr的统计,对用户如何使用标签和用户提供的标签有哪些种类进行了研究;另一方面,基于前一方面的分析,提出了四种不同的标签推荐策略,可以被用户用来向图片增加标签。结果表明,推荐的关联标签具备效率高、多层次的特点。1 相关背景 多媒体标注对大规模检索系统来说非常有用。目前基于内容的图片检索系统在不断演进,但是却不能很好的解决人类之间的语义鸿沟翻译 2011-12-03 09:44:12 · 1538 阅读 · 0 评论 -
关于数学学习(博士必读)
源地址:http://bbs.pinggu.org/thread-589533-1-1.html最近一直有师弟师妹和朋友问我数学和研究的关系,研一要去学什么数学课。毕竟在清华,衡量一个研究生最重要的指标之一就是paper,而没有数学,是肯定上不了世界顶级的期刊和会议的,这在计转载 2011-10-10 18:15:11 · 5398 阅读 · 0 评论 -
Dratf-ietf-decade-survey-04(一)
研究了已经部署的和试验中的网络内部存储系统,描述了这些系统在DECADE中的可参考性。1. 概述DECADE(DECoupled Application Data Enroute)是一个架构,用来提供给应用程序访问网络内部存储的能力。从而使得内容分发应用程序能够减少对网络架构的负担,特别是在最后一跳上的负担。DECADE的一个主要推动力是高容量和低成本的网络存储设备。网络内部存储的实例是支持网页和P2P内容的缓存。和现有的内容缓存不同的是,DECADE允许应用程序对其在网络内部缓存的访问控翻译 2011-05-18 22:23:00 · 956 阅读 · 0 评论 -
Dratf-ietf-decade-survey-04(二)
4已有的网络内部存储系统(1) Amazon S3 通过基于HTTP协议的Web接口提供在线存储服务。用户创建桶,桶里面会包含存储对象。通过提供的接口,用户能够管理他们的桶。其他类似的有Windows Azure提供的Blob服务(暂时译为:滴服务)。 Ama翻译 2011-05-18 22:25:00 · 1983 阅读 · 0 评论 -
Above the Clouds: A Berkeley View of Cloud
云端之上——Berkeley 对云计算的看法——UC Berkeley 可靠自适应分布式系统实验室(http://radlab.cs.berkeley.edu---云计算是个前沿东西,带来了相应的挑战和机遇,对于一个计算机的人来说,虽然技术不是重点,但是趋势和方向是火种,点亮未来翻译 2011-07-23 10:00:32 · 3208 阅读 · 0 评论 -
CDN总结之二
2 CDN架构CDN中的三个主要角色为:CDN提供者、内容提供者以及用户。内容提供者在CDN提供者那儿进行注册而使用服务,将其内容存储到CDN提供者分布式的代理服务器上。内容可能是以提前准备的方式或者基于用户需求的方式存储在代理服务器上,以响应用户的访问。用户的请求将会被最近原创 2011-09-16 11:04:21 · 2495 阅读 · 0 评论 -
CDN总结之三
3 CDN分类如何进行CDN详细的分类,可以参考四个因素进行:CDN的组成、内容分布和管理、路由重定向和性能检测。3.1 CDN的组成CDN结构组成很相近。在CDN结构中,基本包含了:一系列代理服务器:组成内容交付组件,其他机制:代理服务器与其结合将请求重定向到某个代原创 2011-09-17 12:46:30 · 5495 阅读 · 0 评论 -
CDN总结之四
3.3 路由重定向路由重定向系统用来对用户请求转发到合适的代理节点,从而进一步进行内容分发。有的时候最近的代理节点未必就是最合适的。[30]路由转发系统通常会将一些因素例如网络上的邻接性、用户体验时延、距离、服务器负载等作为选择最合适服务器的参考。内容的选择和分发方法对路原创 2011-09-17 13:14:22 · 5750 阅读 · 0 评论 -
一个MIT计算机博士对数学的思考
在过去的一年中,我一直在数学的海洋中游荡,research进展不多,对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界?作为计算机的学生,我没有任何企图要成为一个数学家。我学习数学的目的,是要想爬上巨人的肩膀,希望站在更高的高度,能把我自己研究的东西看得更深广一些。说起来转载 2011-10-10 18:18:15 · 7418 阅读 · 0 评论 -
BigTable简单翻译
Bigtable: A Distributed Storage System for StructuredData简述:Google的很多产品在进行数据存储的时候都用到了Bigtable,例如网页检索、Google地图和Google Finance。这些应用对Bigtable原创 2011-10-03 15:50:07 · 1061 阅读 · 0 评论 -
一致性终极解决方案Paxos
相关名词:提案者(Proposers)、决策者(Acceptors)和学习者(或者说书记Learners)基本说明:提案者可以提相应的法案给各个决策者,得到多数决策者的法案会被记录为法律,学习者会记录在案而生效一致性三个基本条件: a.法案只有在被Proposer提出后才能批准 b.每次只能批准一个法案 c.只有决议确定被批准后Lean原创 2012-12-20 21:34:29 · 1187 阅读 · 0 评论