2009年05月13日

原创 工作规划(1) 基于LU分解的千万阶稀疏矩阵求解器

以下是投给某个研究院的一份工作计划。在稀疏求解器上花了六、七年功夫,也是对这些年的一个小结吧。目前,千万阶矩阵求解以迭代法(含多重网格法)为主。迭代法算法简单,易于实现。处理对称正定矩阵及某些特殊类型矩阵有较好的效果。但总体上很难做到通用,稳定。精度较低,效率上先天不足。直接法(基于LU分解)的精度高,通用性好。尽管直接法同样有很多困难,但这些困难是可以克服的;其潜力巨大,有望得到广泛的应用。1 迭代法的不足尤其对于非对称矩阵,以GMRES,BICG为代表的迭代法需要高质量的预处理器,而目前还没有通用而成熟的预处理算法,在理论上更是难以分析。以ILU为代表的预处理算法越来越复杂,代码长度,运行时间甚至超过迭代法本身,效果仍依赖于具体问题。2直接法的优势1)稳定,通用,精度高       基于恰当的主元技术及预处理技术,目前直接法的表现相当稳定,精度也比迭代法高很多。2)CPU效率可高一个数量级       目前单颗CPU的峰值浮点性能已有超过100G,即阅读全文>

发表于 @ 2009年05月13日 20:57:00|评论(loading...)|举报|收藏

2009年04月20日

原创 虹膜识别软件GIRIST 1.0发布


   GIRIST (GRUS IRIS TOOL) 是一个免费的虹膜识别软件,其性能与商业软件相当. 发布于http://www.grusoft.com/girist.htm。

   GIRIST特性如下:
       平均Decidability > 6.0 
       平均识别率>95% 
       FAR=0.01%, 平均 FRR=5% 
       平均提取时间
       匹配速率>50000 次/秒
       可处理眼脸,睫毛,强光等污染因素 
       匹配旋转角度最大值:  ±15 度 
       虹膜无尺寸限制. 
       数据库无限制
       三种模式: iris authentication, iris identification and iris library verification 
       图形界面
       以上数据来自数万幅虹膜图像阅读全文>

发表于 @ 2009年04月20日 19:41:00|评论(loading...)|举报|收藏

2009年01月27日

原创 人脸检测的一些资源

一些源代码1 A simple and effective source code for DCT-Based Iris Recognitionhttp://www.advancedsourcecode.com/dctiris.asp2 A simple and effective source code for Iris Recognition Algorithm Using Phase-Based Image Matchinghttp://www.advancedsourcecode.com/irisphase.asp阅读全文>

发表于 @ 2009年01月27日 20:00:00|评论(loading...)|举报|收藏

2008年11月09日

原创 PC的浮点计算能力已接近100G

    PC的浮点计算能力已接近100G,即每秒1000亿次浮点计算。目前,Nvidia GTX 280的双精度浮点运算的峰值已达90G FLOPS;8 core Intel  8核CPU的峰值已达81G FLOPS (数据来自于http://forums.nvidia.com/index.php?showtopic=80465&hl=double+precision)这些数据也和我自己做的一些测试吻合,从总体上来看,PC上的浮点计算能力已接近100G。按照这个速度,到明年,不到一万元的机器,就可以实现1000亿次浮点计算,技术发展确实惊人!    这段时间GPU运算成了热点,其单精度的性能确实很突出,每秒接近万亿次运算。但双精度计算与CPU相差并不大,甚至存在被CPU反超的可能。而且显存总是要小于内存。因此我觉得对大型矩阵LU分解而言,在未来的几年里,可能还是以CPU计算为主。    图中是Nvidia实测的DGEMM性能。就我个人的一些经验,对XEON有些低估了。阅读全文>

发表于 @ 2008年11月09日 19:35:00|评论(loading...)|举报|收藏

2008年06月19日

转载 Historical Background about sobolev space

Historical Background sobolev space阅读全文>

发表于 @ 2008年06月19日 12:46:00|评论(loading...)|举报|收藏

2008年04月18日

原创 体验显卡计算--稀疏矩阵求解调用CUBLAS实测

部分密集型运算的科学计算,仍可通过GPU提高性能。 双精度GPU运算是急需解决的问题。 阅读全文>

发表于 @ 2008年04月18日 13:12:00|评论(loading...)|编辑|举报|收藏

2007年12月29日

原创 大型稀疏矩阵求解器GSS 2.0发布

GSS(GRUS SPARSE SOLVER) 是用于求解大型稀疏矩阵的软件包。采用最新的模型及算法,具有高效,稳定,通用等特点。提供10万阶免费试用版,详细信息欢迎访问www.grusoft.com。对比测试表明:速度明显优于同类求解器,其中分解时间平均不到UMFPACK的一半。许多矩阵只有GSS可求解。阅读全文>

发表于 @ 2007年12月29日 09:48:00|评论(loading...)|编辑|举报|收藏

Csdn Blog version 3.1a
Copyright © 柳长街