GitHub的AI程序员“抄袭”算法大神代码!连原版注释都抄上了

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

晓查 发自 凹非寺 
来源:量子位(QbitAI)

本周GitHub官方和OpenAI联合发布了一款代码神器AI——GitHub Copilot,只需输入注释,即可自动生成代码,堪称一位“AI程序员”。真人程序们表示非常激动。

它究竟有多厉害呢?有位程序员尝试了一下平方根倒数速算法(Fast Inverse Square Root),结果出人意料。

只是打出来这四个关键词,GitHub Copilot就逐行“完美复刻”了当年那段神奇的算法。

这是当年在游戏《雷神之锤3》(Quake 3)中使用的一段代码,用于计算归一化向量,因其算法之简洁快速而闻名,也被叫做Quake代码。

我们再对比一下这两串代码,不能说是十分相似,只能说是一模一样。

float Q_rsqrt( float number )
{
    long i;
    float x2, y;
    const float threehalfs = 1.5F;

    x2 = number * 0.5F;
    y  = number;
    i  = * ( long * ) &y;                       // evil floating point bit level hacking
    i  = 0x5f3759df - ( i >> 1 );               // what the fuck? 
    y  = * ( float * ) &i;
    y  = y * ( threehalfs - ( x2 * y * y ) );   // 1st iteration
//    y  = y * ( threehalfs - ( x2 * y * y ) );   // 2nd iteration, this can be removed

    return y;
}
 原版平方根倒数速算法

甚至GitHub Copilot连当年那句“what the fuck”的注释也用上了。

这不禁让人细思极恐:难道这不侵犯版权吗?

还真是!这位程序员发现,GitHub Copilot好像忘了开源许可证,这就尴尬了。

而Quake代码十年前就在GitHub上开源了,在Readme文档中,原作者明确表示使用的是GPL开源许可证。

GPL许可证要求:如果分发包含GPL代码的新版程序,则需要向每个人都提供免费获得的完整源代码。

所以这位程序员只好在代码前手动加入了几行注释,算是给他人的警示吧。

使用Copilot有抄袭风险

关于GitHub Copilot直接“抄袭”Quake代码的事情,在Hacker News论坛上引起热议。

对此,程序员表示,如果贸然使用GitHub Copilot,而忽略了代码背后开源许可证,那么你有可能会被起诉。

一家科技公司的产品安全负责人明确表示:禁止员工使用GitHub Copilot。

如果不开源的商用软件使用GitHub Copilot开发的代码,而没有按照开源许可证的要求执行,就会给公司招来法律风险。

不过,也有程序员表示,我用AI写的程序关我什么事,有责任那也是GitHub母公司微软的。

但是在GitHub Copilot下载页面中并没有相关法律风险的提示,而且GitHub还表示这个AI不是一个“背题家”,它生成的绝大多数代码都是唯一的。

在0.1%的情况下,GitHub Copilot建议可能包含一些来自训练集的逐字片段。

结果GitHub Copilot却把人家整段的代码都抄来了,而且连注释都附带上。

还有程序员表示,不用太担心。其实GitHub Copilot的这种行为,和某些程序员直接抄Stack Overflow的代码没有啥区别,因为很多Stack Overflow上的代码也没有给出许可证信息。很多直接搬运Stack Overflow代码的行为也没有被起诉。

但是谨慎起见,用GitHub Copilot还是长点心吧。

One More Thing

最后关于Quake代码这件事,还值得再说两句。

由于当年显卡等图形渲染硬件的配置较低,为了能实现更好的光照效果,必须对算法进行极致优化,而求平方根倒数是绕不开的一项运算,每秒要进行上百万次。

因此就有一位算法大神,通过浮点数与整型的转换,以及移位操作,成功将求平方根倒数压缩到短短几次操作。(详细原理可参照维基百科介绍)

关于这个算法究竟是谁发明的,一直众说纷纭,没有定论。但那句注释让Quake代码更加出名。

当年开发《雷神之锤3》的程序员使用了大神的算法,却没有看懂其中的精髓:“i = 0x5f3759df - ( i >> 1 ); ”这一句 ,所以只好在注释里写下了“what the fuck”。

没想到近20年后,AI还是和人一样成了复读机,只能膜拜算法大神了。(手动狗头)

参考链接:
[1]https://twitter.com/mitsuhiko/status/1410886329924194309
[2]https://news.ycombinator.com/item?id=27710287
[3]https://github.com/id-Software/Quake
[4]https://en.wikipedia.org/wiki/Fast_inverse_square_root#History

CVPR和Transformer资料下载

后台回复:CVPR2021,即可下载CVPR 2021论文和代码开源的论文合集
后台回复:Transformer综述,即可下载最新的两篇Transformer综述PDF
CVer-Transformer交流群成立
扫码添加CVer助手,可申请加入CVer-Transformer 微信交流群,方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。
一定要备注:研究方向+地点+学校/公司+昵称(如Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲长按加小助手微信,进交流群▲点击上方卡片,关注CVer公众号
整理不易,请给CVer点赞和在看
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 关于在GitHub上找到SIFT算法的C语言实现代码,以下是一个可能的回答: 在GitHub上,有许多不同的SIFT算法实现代码,可以根据个人的需求和偏好进行选择。 一种常用的SIFT算法实现是VLFeat库(https://github.com/vlfeat/vlfeat)。VLFeat是一个流行的计算机视觉库,提供了各种计算机视觉算法的高效实现。它包含了SIFT特征提取和匹配的C语言实现代码,可以用于图像特征提取和对图像进行匹配和物体检测。VLFeat库还提供了用于处理图像和特征向量的其他功能和实用工具。 在GitHub上,还有其他实现了SIFT算法的库和代码,如OpenCV库(https://github.com/opencv/opencv)。OpenCV是一个功能强大的计算机视觉和机器学习库,提供了SIFT算法的C++实现,同时还提供了与其他编程语言的接口。通过OpenCV,你可以使用C++代码实现SIFT特征提取和匹配,并集成到你的项目中。 除了库之外,你也可以在GitHub上找到一些独立的SIFT算法实现。只需在GitHub的搜索栏中输入"SIFT"或者相关关键词,就会显示与SIFT算法相关的代码库和项目。你可以筛选展示的结果,根据项目的活跃程度、代码质量和其他用户的评价来选择适合自己的实现代码。 总的来说,GitHub上有许多实现了SIFT算法的C语言代码,可以根据个人需求选择合适的库或者项目来使用。无论是VLFeat库还是OpenCV库,或者其他独立的实现代码,它们都为开发者提供了实现SIFT算法的工具和资源。 ### 回答2: SIFT(Scale-invariant feature transform,尺度不变特征变换)是一种计算机视觉算法,用于在图像中检测和描述局部特征。如要在GitHub上找到用C语言实现的SIFT算法代码,可以按照以下步骤进行: 1. 打开GitHub网站 (https://github.com)并登录账号。 2. 在搜索框中输入关键词"SIFT C",点击搜索按钮。 3. 在搜索结果中选择与SIFT算法相关的代码库。可以通过阅读项目的描述、README文件和代码示例来判断是否是我们需要的算法实现。 4. 确保选择的代码库使用C语言作为主要编程语言,以确保我们找到了C语言实现代码。 5. 查看代码库的目录结构,确认是否包含实现SIFT算法的C代码文件。 6. 点击代码文件进行查看,并阅读代码注释和实现逻辑,以确保代码是可理解和可维护的。 7. 如果代码符合要求,下载或克隆整个代码库到本地计算机中,以便进一步进行使用和调试。 需要注意的是,在GitHub上搜索到的代码库可能包含不同版本和不同作者的实现,因此要根据自己的需求选择适合的版本和质量较高的实现。 希望以上回答能帮助您在GitHub上找到合适的SIFT算法C实现代码。 ### 回答3: 在Github上,有许多关于SIFT(尺度不变特征变换)算法的C语言实现代码。SIFT是一种计算机视觉算法,可以用于图像特征提取和图像匹配。以下是一个大致描述SIFT算法C语言实现的步骤: 1. 尺度空间构建:使用高斯差分金字塔来模拟图像的尺度空间结构。这个过程可以对输入图像进行多次高斯模糊操作,生成不同尺度的图像。 2. 极值点检测:通过比较像素值与其周围像素值,找出图像中的极值点。这些极值点通常表示图像的显著特征。 3. 关键点定位:对于极值点,使用插值的方法将其精确定位在图像上。这一步骤还会排除掉边缘响应和低对比度的点。 4. 方向分配:对于每个关键点,使用局部图像梯度的方向来确定其主方向。这个方向将用于后续的特征描述。 5. 特征描述:在每个关键点周围的区域内,通过计算局部图像的梯度直方图来描述特征。这一步骤将生成一个具有128维的特征向量。 以上是一个简单描述的SIFT算法的C语言实现步骤。在Github上可以找到许多不同的SIFT算法实现,包括开源库和个人项目。你可以搜索"SIFT C code"或者是具体的项目名称来查找,并根据自己的需求选择适合的代码实现。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值