From the Book:
Peer-to-Peer Video: The Economics, Policy, and Culture of Today's New Mass Medium (Hardcover)
http://www.amazon.com/Peer-Peer-Video-Economics-Culture/dp/0387764496
Characteristics of the five most popular Peer-to-Peer systems
P2P System | Strong Points | Weak Points |
FastTrack (KaZaA) | Popularity, Availablity, Content lifetime | Pollution level |
Overnet (eDonkey) | Popularity, Content lifetime | Download performance |
BitTorrent | Popularity, Download performance, Content injection time, Pollution level | Availablity, Content lifetime |
DirectConnect | Download performance, Content lifetime | Availablity |
Gnutella | Download performance | Popularity, Pollution level |
From J.A. Pouwelse, P.Garbacki, H.H.J. Epema, and H.J. Sips, "A Measurement Study of the BitTorrent Peer-to-Peer File-Sharing System," at 7, preprint available at http://www.pds.ewi.tudelft.nl/reports/2004/PDS-2004-003/pdsreport.html
Chareacteristics and Potentials of Youtube: A Measurement Study
Xu Cheng, Cameron Dale, Jiangchuan Liu
爬行了3个月,百万个视频。2007年2月22日至2007年4月,24个数据集共2676388视频。
类似工作:Huang SIGCOMM'07, Can Internet Video-on-Demand be Profitable?
但是研究的是MSN Video, Microsoft的VoD service,传统,视频少,普遍比Youtube上时间长,也没有相关视频链接,即没有social networking的特征。
Youtube 视频特征:
- Video Meta-data:上传者、上传时间、类别、时间长度、观看人数、评级分数、评论数、相关视频列表
- 最流行的类别:音乐22.9%、娱乐17.8%、搞笑12.1%
- 视频长度:97.8%视频在600秒内,99.1%视频在700秒内(其中一个原因:普通用户有10分钟的长度限制)
- 文件大小和比特率:98.8%视频小于30MB,平均大小在8.4MB左右,海量存储的探讨在另外一篇论文里提到(Cheng X. IWQoS 2008)。比特率在330kbps左右
- 数据添加:slow start,increase steeply
- 观看-用户访问模式:观看人数是视频评级的函数,长尾效应。访问模式没有遵从Zipf分布,直线部分应该是log-log scale,尾部下降tremendously
- Social Network:明显的small-world现象。clustering coefficient系数达0.3,很高,random graph几乎是0。characteristic path length是8左右,比对应的random graph略大,在如此高的系数下,路径保持稳定是非常好的。
P2P能拯救Youtube么?
Youtube用的是C/S架构。P2P的应用有挑战性:视频太短,甚至多数短过P2P Overlay的建立连接时间。用户会在上一个视频播放完时迅速缓冲其他视频,Overlay会承受很大的churn rate。视频太多,Overlay很小。
如果一组相关视频能合并成一个大的视频(比如分成9个片段的“我猜”?哈哈),那么Overlay就会大一些,也会稳定些。
避免单点失效。但是有版权的视频会经常被删除,如果有了P2P,会让有版权的视频传播的更快,使得版权保护的情况更差。
仿真(合理情况下,而非最优情况下),在P2P模式下,服务器带宽只有39.8%的C/S模式下的带宽。
BBF注:此文仅仅是科学上的探讨,参考价值有限,未能提出实质性的建议。