如何优雅的抄袭代码?天下代码一大抄,这才是正确的姿势

转载 2017年12月03日 00:00:00

【回复“1024”,送你一个特别推送】

?wxfrom=5&wx_lazy=1

你们知道程序员最熟悉,最熟练,最常用的两个快捷键是哪两个吗?没错,估计你现在心中所想的就是:ctrl+c 和 ctrl+v ,俗名为:复制和粘贴。对于大部分程序员来说:复制和粘贴就是他敲代码,写程序员创造伟大产品的左膀和右臂,而复制和粘贴更是形影不离的好兄弟。

所谓,天下代码一大抄,亦不过在程序员心中就是复制和粘贴。更何况我们是身处在一个热爱开源的世界,而程序员更是创造和开创开源世界的积极分子呢。目前,我们身处在共享经济当中,可是殊不知我们这是一个伪共享的时代。共享单车,共享汽车,乃至共享充电宝都不是真正的共享,所谓共享就是把闲置和剩余资源利用起来,进行分享,以达到资源利用,资源价值的最大化。现在的共享经济,都不是把闲置和剩余资源的重复再利用,而是花钱买好的,每天,每月正在造成更大的资源浪费。

但是,代码的开源,技术的开源可以说是真正的共享,但是还不属于经济,毕竟开源太多都是免费的,所以,我们技术开源才是真正的共享鼻祖。有点扯远了,我尽量拉回来。之所以谈这个话题是因为近日加州大学欧文分校、捷克技术大学、微软研究院和美国东北大学的研究人员组成的一个团队开展了一项调查,结果发现,GitHub 上托管的大多数源代码文件实际上是以前所创建的文件的复制版

八名研究人员组成的这个国际团队起初倒不是想研究 GitHub 的重复现象。最初的目标是试图定义代码复制的 “精细度”(即不同的复制版之间多少文件发生了变化),但后来他们发现了 “高得惊人的文件重复率”,于是他们改变了研究方向。

研究人员查看了 450 万个原创(非分支)的 GitHub 项目,这些项目共有 4.28 亿个不同的文件。他们发现,只有 8500 万个文件是独特的,在所有分析的文件中约占 17.63%。

其实 GitHub 的一个使命就是共享代码,所以在 GitHub 平台上发现代码重复率高并不是一个令人吃惊的事情。但是有一点是非常让你警醒的,那就是:

用来构建 GitHub 的源代码控制系统 Git 鼓励项目分支(forking)。然而,GitHub 中出现了大量的代码重复现象,这些代码并没有经历过 fork 机制,而是通过复制粘贴文件、甚至复制粘贴整个库进入的。

很多研究人员也表示了疑问,明明可以 fork 或者依赖使用的,现在大部分人都是复制粘贴文件、甚至复制粘贴整个库到自己的项目,再共享出来,真的是让人有点吃惊。

   开源库的正确用法

由此,我们应该得感觉和意识到一些开源许可证的使用,应该正确使用开源库以及开源代码才可以。不知道有多少开发者意识到了开源库的正确使用方法?我相信现在几乎每个程序员开发的项目中都使用了 GitHub 上的开源库,但是你们尊重开源和版权了吗?一般在应用中应该声明一下使用了哪些开源库,以开源许可证等信息。我发现支付宝在这方面做的就挺好的。比如人家就在应用中有个版权信息模块,专门声明使用了哪些开源库。例如:

?

看到了吗?支付宝这个应用程序用到的开源库是不是很多,大家也可以研究一下,支付宝用的这些开源库应该都是非常不错,有保证的,以后说不定你也能够用到,这就是学习。我相信大家都没有正确使用和声明开源库这种做法和行为。

   总结

其实通过研究其实我们可以发现:首先,GitHub 本身似乎可以大幅压缩代码库,不至于现在这么庞大。其次,如今在使用从 GitHub 唾手可得的一大批开源项目,开展越来越多的研究工作。但是我们在研究和使用的时候,应该正确使用,而不是乱用

?

你们知道哪种语言在 GitHub 上代码重复率最高吗?JavaScript 项目含有的重复文件最多,研究团队只查看了用 C++、Java、JavaScript 和 Python 编写的源代码项目。在这四种项目中,JavaScript 项目所含的重复代码最多,94% 的文件是与 GitHub 上托管的另一个文件百分之百相同的克隆版(基于文件哈希)。C++ 排名第二,所有文件中 73% 是其他文件的复制版,而 Python 的代码重用率也有 71%, Java 只有 40%。其实JavaScript 包含最多的重用代码示例,原因很容易解释,那就是 NPM,这是所有客户端和服务器端 JavaScript 项目的事实上的软件包管理器。

所谓天下代码一大抄,但是抄也应该正确的抄,也应该正确的用,在规则和许可下玩才行。不要在没声明的情况下,整体的复制粘贴到你的代码库里,不尊重作者,感觉是你做的似的。

?

?

如何优雅地抄袭代码?天下代码一大抄,这才是正确的姿势

点击上方“CSDN”,选择“置顶公众号”关键时刻,第一时间送达!作者简介:loonggg,一个文艺傲娇而又喜欢编码的程序猿,一个喜欢挑战而又喜欢分享的攻城狮。一个科技数码爱好者,又是一个爱好写作的达人...
  • csdnnews
  • csdnnews
  • 2018-01-29 00:00:00
  • 232

抄代码,可以抄到什么程度

  抄代码,可以抄到什么程度   最近,老是有同学跟我提到 “不会写代码,只会从网上抄“,在加上前两天提到 的本科毕业论文同学“做“过的微博系统,觉得有必要说一下   1. 什么是可以从网上抄的.最粗...
  • younggift
  • younggift
  • 2011-03-20 00:33:00
  • 4656

1355 代码抄袭

描述 考虑题目较难,同时为了鼓励同学们下去自己练习...我们今天把这题放上...以前写过的,直接放代码就过了。要是做完又回去自己没做的同学,下次记得做不出的题回去尽量琢磨琢磨。判断2个代码是抄袭是很必...
  • jj12345jj198999
  • jj12345jj198999
  • 2011-07-24 10:43:28
  • 1281

检测代码抄袭

  • 2012年10月26日 19:29
  • 635B
  • 下载

阅读laravel源代码有感

由于公司一直使用的是yaf框架,至少有很多项目是基于yaf框架的。相信所有用过yaf的朋友们也能够清晰的感受到yaf的功能是在是太简洁了,基本上就提供了一个mvc模式、一个自动加载机制、一个路由机制,...
  • xinguimeng
  • xinguimeng
  • 2015-08-25 00:53:49
  • 1416

【手游】率土之滨 美术资源加密分析

有个网友让我帮忙分析一下这个游戏的资源加密方式,分析后...发现只是简单的异或加密 0x00 资源中大部分png图片加密了 game目录下的lua文件加密了 音效文件没加密只是打包了成了.fsb ...
  • BlueEffie
  • BlueEffie
  • 2016-11-19 01:26:51
  • 3107

率土之滨-建筑升级

率土-建筑升级语言描述今天说明一下游戏里面的语言的使用。 上限定义 一个物品的某属性有上限,比如在RPG游戏里面,人物的背包有容纳上限。比如最多只能存放100种物品,这里的最多100就是指的上限了。...
  • A297456507
  • A297456507
  • 2016-07-16 10:54:37
  • 573

如何优雅的抄袭代码?天下代码一大抄,这才是正确的姿势

【回复“1024”,送你一个特别推送】 你们知道程序员最熟悉,最熟练,最常用的两个快捷键是哪两个吗?没错,估计你现在心中所想的就是:ctrl+c 和 ctrl+v ,俗名为:复制和粘贴。对于...
  • OQjya206rsQ71
  • OQjya206rsQ71
  • 2017-12-03 00:00:00
  • 3674

自由开发者如何赚钱?一个独立开发者的心路历程

【回复“1024”,送你一个特别推送】 原文作者:MikeTech 原文地址:https://miketech.it/2016-self/ 特别声明:本文为MikeTech原...
  • OQjya206rsQ71
  • OQjya206rsQ71
  • 2017-11-30 00:00:00
  • 2814

你怎么看待自己的代码被抄袭?

码农界抄的一塌糊涂,你一定也感同身受
  • beckett1216
  • beckett1216
  • 2016-07-12 15:58:36
  • 244
收藏助手
不良信息举报
您举报文章:如何优雅的抄袭代码?天下代码一大抄,这才是正确的姿势
举报原因:
原因补充:

(最多只允许输入30个字)