你是否 diss 过别人的代码?—— 怎样的代码才算优秀?

写在前面:一名有三年Android开发经验的女程序员(欢迎大家关注我 ~期待和大家一起交流和学习Android的相关知识)

你一定在内心吐槽过别人的代码太烂:没注释、逻辑混乱、到处都是 magic number、实现方案过时、耦合严重、一改就出 bug。

此时心中的怒火油然而生,仿佛自己是正义的化身,要代表月亮消灭这样的代码,甚至拼写错误也可以成为你 diss 的点。稍等片刻,先抑制一下燃烧的小宇宙,你有没有认真想过“到底什么样的代码才算的上优秀?”

在看了 Gerald M. Weinberg 的《The Psychology of Computer Programming》后让我有了不一样的认识。不过我觉得这是一个开放问题,不同情况下会有不同答案,欢迎讨论。

可行性

作者给出的第一个标准是“程序的可行性”,它是指对于任何一种约定的输入,程序都能给出期望的输出。毕竟可行的程序总比不可行的要好。在不满足可行性前提下的优越性能,高可扩展性都不值一提。
但不可否认的是,我们脑子里成天考虑的是这些次要问题。甚至会形成“不优雅就是垃圾”的价值观,好像只有这样才可以在内心自恃高人一等。获得这种莫须有的优越感的代价可能是写出了不可行的代码,捡了芝麻丢了西瓜。

引用一段原文:

如果程序根本无法正常运转,对其效率、适应性及生产成本的评估就毫无意义。无论如何,我们需要务实一些,需要承认:也许根本没有哪个完美的程序曾经被写出来过。每一个真正大型和重要的程序都必然包含很多个纰漏。所以对程序进行评估时,必须考虑到其不完美的一面。

按时性

作者给出的第二个标准是“按时性”。

即使不考虑可行性的问题,效率的问题仍然不是最重要的。程序开发中经常遇到一个问题是要符合开发的日程计划,推迟完成的程序常常没有意义。

我们不得不比较一下,到底是一个可能在未来完成的高效程序带来的潜在节省更大,还是没有一个程序损失更大。现实中,往往是后者的损失更大。

真正困扰人们的并非是预先估计的平均开发时间,而是实际消耗时间的标准偏差。就好比大多数人宁可每天早上花固定的10分钟等公交车,也不愿意每周有4天只等1分钟,而最后一天等26分钟,尽管就平均等待时间而言,后一种方案只需要6分钟,但由于某次无法预测的长时间等待就会打乱计划,这点好处无法弥补其损失。所以宁可承诺一个更留有余地的排期,然后按时完成。而不是承诺一个满打满算的排期,然后delay。

开发过程中遭遇的各种意外导致实际消耗时间和预估时间形成方差,这一问题是值得我们深入思考的。如何提前感知不确定性,如何快速解决意外,是一项需要不断提升的能力以减小方差。

适应性 & 效率

作者给出的第三个标准是“适应性”,即程序的可扩展性。紧跟其后的标准是“效率”,即程序运行的性能。
总算轮到了本以为重要的标准,作者的一席话描述地入木三分:

在软件生命周期内,多数程序都会被修改,无论其经验的多少,绝少有哪位程序员能反驳这一论断。既然如此,为什么在必须修改以前的程序时,我们总是觉得这项任务如此艰巨,以至于往往决定弃之不用,干脆自己从头写起呢?只要阅读过程序,我们就会透过这些程序发现:实际上,很少有哪位原作者会考虑可能的后续修改。

作者还提了两个问题来表达程序员的矛盾之处:

在编写程序时,你曾经有多少次想到过它在未来可能被别人修改?反过来,在修改别人程序时,你又曾经咒骂够几回?

之所以把适应性和效率放在一起讨论,是因为它们俩会此消彼长,作者用 Fisher 定理来证明这个观点:

Fisher定理:一个系统对某一特定环境适应性越强,它适应新环境的能力也就越弱。

如果强调的是程序的效率,那么我们往往会追求紧密式的代码,而如果在未来要对这些代码进行修改,那将会非常棘手。如果使用的是更高层的语言,那么为了使程序更高效,我们往往需要深入到机器语言层。这种做法至少抵消了原本用更高层语言编程的一个好处 —— 在不同机器之间的可移植性。其实际效果是,我们将被局限于特定的某台计算机或特定的某个实现。

回想设计模式,无一例外是通过增加一层抽象以达到可扩展的目的,这样的设计增加了类的数量,类的构建和类方法调用的都会消耗空间和时间的性能,降低了效率。而且它让功能的实现变得更加间接,也增加了理解成本,降低了沟通效率。

但作者认为性能问题不是问题:

运行效率正在成为计算中一个日益不明朗的问题,随着单位计算能力成本的逐年下降,以及单位程序开发成本的不断提高,在程序开发方面比在产品方面投资更多的典型做法,早已不合时宜。因此我们期望,随着岁月的推移,我们听到的关于效率的言论将会越来越少。

紧接着依然是两个耐人寻味的问题:

你是否曾经因为追求效率而延误了工作进度?反过来,是否曾经因为要赶时间完成而没有做到尽善尽美?

但有趣的是,面试时,极少有公司是按照上述的优先级来考察候选人的,通常的考察优先级正好相反,即使有算法笔试也是把重点放在实现方案的内存性能或时间性能上,并不会对程序的正确性进一步追究。

  • 8
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 10
    评论
### 回答1: Nbclust包的代码包括: 1. nbc_search:用于搜索最佳聚类参数组合的函数; 2. nbc_extract:用于从搜索结果中提取最佳参数组合的函数; 3. nbc_evaluate:用于评估聚类模型的函数; 4. nbc_plot:用于绘制聚类模型的函数; 5. nbc_select:用于从多个聚类模型中选择最佳模型的函数; 6. nbc_predict:用于预测样本属于哪个聚类的函数; 7. nbc_compare:用于比较不同聚类模型的函数; 8. nbc_hclust:用于层次聚类的函数; 9. nbc_kmeans:用于K-means聚类的函数; 10. nbc_gmm:用于Gaussian Mixture Model聚类的函数; 11. nbc_pam:用于Partitioning Around Medoids聚类的函数; 12. nbc_xmeans:用于X-means聚类的函数; 13. nbc_fanny:用于FANNY聚类的函数; 14. nbc_clara:用于CLARA聚类的函数; 15. nbc_diana:用于DIANA聚类的函数; 16. nbc_monocrit:用于Monocrit聚类的函数; 17. nbc_agnes:用于AGNES聚类的函数; 18. nbc_som:用于Self-Organizing Map聚类的函数; 19. nbc_dbscan:用于DBSCAN聚类的函数; 20. nbc_optics:用于OPTICS聚类的函数; 21. nbc_hdbscan:用于HDBSCAN聚类的函数; 22. nbc_cobweb:用于Cobweb聚类的函数; 23. nbc_em:用于Expectation-Maximization聚类的函数; 24. nbc_clustree:用于Clustree聚类的函数。 ### 回答2: R语言中的Nbclust包是一个用于进行聚类分析和判别分析的工具包。它提供了一系列函数和方法来评估聚类的质量,并为用户提供了选择适当聚类数的建议。 以下是使用Nbclust包的完整示例代码: ```R # 1. 安装和加载Nbclust包 install.packages("Nbclust") library(Nbclust) # 2. 准备数据 data <- iris[, 1:4] # 使用鸢尾花数据集的前4列作为示例数据 # 3. 运行Nbclust函数 # 以下是Nbclust函数中的参数选项,根据需要进行调整 # data:输入的数据对象 # diss:距离矩阵或相似度矩阵 # distance:用于计距离矩阵的距离度量方法(默认是欧氏距离) # min.nc:最小聚类数 # max.nc:最大聚类数 # method:用于生成聚类索引的方法(默认是"ward.D") # index:用于评估聚类质量的指标集合(默认包括30个指标) # nfactors:主成分分析的因子数(默认为5) # alpha:主成分分析的显著性水平(默认为0.05) result <- NbClust(data, diss = NULL, distance = "euclidean", min.nc = 2, max.nc = 10, method = "ward.D", index = "all") # 4. 查看聚类评估结果 print(result$Best.nc) # 最佳聚类数 print(result$All.index) # 所有选择的指标结果 print(result$Best.partition) # 最佳聚类结果 ``` 以上是使用Nbclust包进行聚类分析的完整代码示例。用户可以根据自己的数据和需求调整数据准备和函数参数。 ### 回答3: Nbclust包是R语言中用于集群分析的一个包。下面是列出了Nbclust包中的主要代码: 1. 安装Nbclust包: ```R install.packages("Nbclust") ``` 2. 载入Nbclust包: ```R library(Nbclust) ``` 3. 使用Nbclust进行集群分析: ```R data <- read.csv("data.csv") # 读取数据文件,将数据保存在data变量中 # 指定要进行聚类的数据列 data <- data[, c("col1", "col2", "col3")] # 设置参数 nb <- NbClust(data, distance = "euclidean", min.nc = 2, max.nc = 10, method = "kmeans", index = "all") # 查看评价指标值和最佳聚类数 print(nb$All.max) ``` 上述代码中,首先安装Nbclust包,然后加载该包。接下来,读取要进行集群分析的数据,并指定要进行聚类的数据列。然后,设置NbClust函数的参数,其中distance设置为"euclidean"表示使用欧氏距离计相似性,min.nc和max.nc指定了聚类数的范围,method设为"kmeans"表示使用k均值聚类法,index设为"all"表示计所有可用的评价指标。最后,通过print语句打印出评价指标值和最佳聚类数。 希望以上回答能够帮到你!
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值