数据结构与算法的学习问题——The Data Structures and Algorithms Learning Problem

原文:The Data Structures and Algorithms Learning Problem

作者:Steven Lott  

链接地址:https://dzone.com/articles/slott-software-architect-the-data-structures-and-a?edition=164351&utm_source=Daily%20Digest&utm_medium=email&utm_content=Daily_Digest_A3&utm_campaign=dd%202016-04-18&userid=1435421


正文


       这是一份电子邮件的片段:

       ———————————————————————————————————
       在大数据(数据科学)中,维度灾难一次又一次的出现。

       这是维基中关于curse of dimensionality(维度灾难)的链接。

       这个问题看起来是大量大数据(数据科学)人员没有花时间去学习数据结构导致的。

        ———————————————————————————————————

       里面说了很多关于Hanan Samet写的《多维数据结构和数据结构度量基础》太过详细,栈溢出太高,以及之后的束手无策。

       这封邮件是在请求 给他一些书籍或者系列博客 能够 在一些基础性的数据结构和算法问题上 去教数据科学工作者们。大概是想让他们在处理K近邻法问题时放弃一些度量,或者开发出一些其它的数据结构。

       我认为....


       我猜吧(像很多令人费解的邮件那样),因为它没有在里面添加代码。好吧,我就是这么偏执的区分这种有代码的和这种没有代码令人费解的。

       如果意识到缺少适当的数据结构,那么真正应该开始学习的是Steven Skiena写的《算法设计手册》。

       然而,我对这是否是真正的问题还是心存疑惑。我认为计算机应用的大范围使用会导致大量的专业化。而且我认为去尝试考虑用一个全才去处理深度数据科学以及算法设计和性能问题是不明智的。没人期望他们用JavaScript去写代码,然后用CSS去修修补补然后让网站展现的很好看。

       事实上,我认为真正的问题是人们对他们的数据科学家们要求太多了。

       在幻想中,摇滚明星是一个跨越OS到CSS的全栈开发者。而在现实中,开发者们是有各自的特长和兴趣的。在某些情况下,“全栈”就意味着在很多领域里都表现平平。

       有一个更好的答复是:连接数据科学和开发运维之间的沟壑。我认为问题不是“大数据(数据科学)工作者们没有花时间去学习基础性的数据结构”,而应该是大数据是一个合作式的探险,它需要一个团队去共同解决问题。



补充知识


       curse of dimensionality:维数灾难

       k-NN:k近邻法

       DevOps:开发运维

评论 29
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值