简单学点大模型-环境影响-CSDN博客

本文链接：https://blog.csdn.net/2201_75734742/article/details/133148632

11.1 大模型对环境的影响

一、生产：

原材料提取：提取矿石以及转化为金属的所有过程
制造：包括制造设备的所有过程
运输：设备运输过程

对环境影响示例：

法国仅使用CPU的数据中心：40%的温室气体排放源于生产阶段（全球变暖)
设备制造排放量占iPhone 5总排放量的75%（全球变暖）
用于制造电子设备的矿物（锂、钴）为不可再生资源（非生物资源枯竭）
芯片制造在制造过程中产生有毒废料（对人类的危害）

二、使用：设备的实际能耗，主要取决于能源（煤炭或水电）的碳强度（使用每千瓦时能源排放的碳量）

对环境影响示例：

1、数据中心使用水进行冷却（消耗淡水资源）

2、发电是数据中心第二大用水需求，处理水和废水需要电力（消耗电力）

2018年，全球数据中心用电量为2050亿千瓦时（占总用电量的 1%）
在美国，2014年数据中心用电量占总用电量的1.8%。

3、超参数搜索是语言模型相关碳排放的重要来源（全球变暖）

三、寿命终止：拆除、回收/处置设备

对环境影响实例：80%的电子设备未被正式回收，释放到环境中（空气、水、土壤）的化学物质，可导致癌症等（对人类的危害）

在整个过程，

化石燃料（煤、天然气）产生的排放量最多（来自直接排放）e.g.美国温室气体排放总量的0.5%来自于数据中心
如果考虑到整个生命周期（发电厂建设、采矿、废物管理），其他绿色能源（太阳能、风能）也会产生排放
在魁北克运行同样的任务（水电）的排放量将比爱沙尼亚（煤炭）少30倍

11.2 估算训练模型的排放量

11.2.1 ML CO2 Impact Calculator

Machine Learning CO2 Impact Calculator提供了⼀种基于硬件、使用的小时数、供应商和地区来估计排放量的简单方法。

有关ML模型训练的详细信息作为输入：服务器的地理区域、GPU的类型和训练时间，并将产生的CO2eq的大致量作为输出。

该方法收集了该计算的4个主要变量的公开可用数据：（i）硬件的能耗，（ii）提供商计算区域的位置——我们假设该区域连接到其本地电网，（iii）该区域每千瓦时的二氧化碳排放量，以及（iv）提供商购买的潜在补偿。作者打算采取一种公开透明的方法：使用的数据是公开的、有争议的，并且可以通过Github问题和拉取请求进行编辑。因此，随着更多信息的提供，对更新数据持开放态度。

为了量化碳排放，使用了二氧化碳排放当量CO2-equivalents（CO2eq），表示人类生产和消费活动过程中排放的温室气体总排放量。这是一种标准化的衡量标准，用于将各种温室气体的全球变暖潜力表示为单个数字，即具有同等全球变暖影响的二氧化碳量。

实际上，很难准确估计给定位置的云服务器排放的二氧化碳当量，因为它所连接的电网的信息很少公开。然而，如果我们假设所有服务器都在其物理位置连接到本地电网，我们就可以使用公共数据源估计它们排放的二氧化碳当量。因此，为了创建这个排放计算器，作者收集了不同网格位置的二氧化碳排放数据，并将其与三大云提供商（谷歌云平台、微软Azure和亚马逊网络服务）的已知GPU服务器位置进行了交叉引用，以说明排放当量根据给定服务器的位置存在的可变性程度。

神经网络训练系统排放碳的另一个更微妙的因素是模型所使用的计算基础设施和训练时间。在性能方面，GPU 的每秒浮点运算(FLOPS)的数量近年来一直在稳步增加，从2004年的每秒100Giga FLOPS 增加到最近硬件中的每秒15 Tera FLOPS 。然而，随着神经网络体系结构变得越来越深入和复杂，最近最先进的模型经常在多个 GPU 上训练数周(或数月) ，以超过基准性能，这需要越来越多的能量。