数据科学
qq_32673453
这个作者很懒,什么都没留下…
展开
-
从优化角度看L1正则化的稀疏性
背景 大数据背景的几个特点:量大large scale,实时性动态产生数据,结构化/半结构化数据,可信赖程度低(Noise,考虑模型如何更robust),高维度且稀疏的数据集。 这里主要说高维稀疏数据带来的一些问题: x=(x1,x2,⋯ ,xp)x=\left(x_{1}, x_{2}, \cdots, x_{p}\right)x=(x1,x2,⋯,xp), 特征是p维,数据样例有n个,...原创 2020-04-19 11:10:57 · 645 阅读 · 0 评论 -
hadoop单机与伪分布配置/Python执行任务
hadoop的单机与伪分布配置。 Python跑wordcount程序的问题记录。 详情: https://saruagithub.github.io/2020/04/06/20200406hadoop%E9%85%8D%E7%BD%AE/原创 2020-04-14 16:31:13 · 143 阅读 · 0 评论