以下这篇文章写的非常深刻, mark一下。
http://freemind.pluskid.org/machine-learning/sparsity-and-some-basics-of-l1-regularization/
另外, 这篇文章介绍了 针对具体数据特性, 处理overfitting的问题时, 如何选择L1还是L2 regularization
http://metaoptimize.com/qa/questions/5205/when-to-use-l1-regularization-and-when-l2