gets函数的不安性详解

最新推荐文章于 2022-10-11 17:24:32 发布

DragonWar%

最新推荐文章于 2022-10-11 17:24:32 发布

阅读量1.2k

点赞数 3

文章标签： c/c++ 操作系统

原文链接：https://yq.aliyun.com/articles/552741

版权

本文详细探讨了C语言中gets()函数的不安全性，由于可能导致缓冲区溢出，此函数在C2011标准中已被移除。文章提到，虽然fgets()函数作为替代，但实现相同功能时仍需额外处理。作者分享了gets()函数的隐患，以及如何通过警告工具和安全函数（如gets_s()）来应对这一问题。

摘要由CSDN通过智能技术生成

1 为什么gets()函数还在我们的代码中？

好吧，最终还是发生了。我们遇到了一个非常严重，并且非常普遍的缓冲区溢出问题。这个问题造成了非常大的影响，修复这个问题的过程，将会非常艰难，非常慢，代价非常高。在我看来，可能在这个世界上，会有不少软件产品经理这样问程序员们：“为什么你没有警告过我？”，估计这些被问到的程序员中，有很多都会直接回答道：“我警告过你了，你什么没有听进去？“

在软件开发的过程中，总是存在一个矛盾：正确的解决问题和快速的解决问题。这个问题在安全领域更加的突出。因此在接下来的几周时间里，我们来聊聊这个矛盾。这个矛盾的如下两个方面，在我们聊的过程中相当的重要：

不管你针对问题的解决方案有多完美，如果没有人使用这个解决方案，都是无用功
不管是处于什么目的，如果你没有使用完美解决方案，那所有的考虑都是白费功夫。因为你的代码里没有实现该解决方案

让我们从这个看起来非常俗气的例子开始吧：C标准库中的 gets() 函数。这个函数的定义如下：

char * gets ( char * str );

gets() 函数的形参只有一个指针。它会从标准输入流中读字符到一块连续的内存地址空间中。这块地址空间的开始位置就是指针 str 指向的位置。当在输入流中遇到文件结束符( EOF )或者换行符(n)时，读取操作结束。当读入换行符(n)时，该字符不会被放入那块连续的地址空间中。在读取结束时， gets() 会自动在内存空间的末尾追加一个 NULL 字符。经过上述这些操作，对于程序员来说，这个函数得到的就是从标准输入进来的，以 NULL 字符结尾的C字符串。如果读入的字符流是一整行的话，行尾的换行符将会被舍去。

这个函数方便，也有局限性。 C程序员们经常使用它读取标准输入。下面的代码是一种典型的应用场景：

代码如下	复制代码
char input[100]; printf("Yes or no?n"); gets(input); /* and so on… */

在过去的30年里，许多C编程社区的同仁们都已经意识到 gets() 函数不安全，而且在保证接口不变的情况下，也无法被改良。原因也比较直观，这个函数只有一个指针作为参数，该指针指向的内存空间将用于保存读入数据。但是 gets() 函数无法知道它需要使用多大的内存空间。如果在标准输入中读入足够长的，不包含换行符的字符留， gets() 函数肯定会覆盖掉指定的内存区域，而程序员对此无能为