【tf2-基础】分布式训练

最新推荐文章于 2023-10-09 09:15:29 发布

alexliu2360

最新推荐文章于 2023-10-09 09:15:29 发布

阅读量427

点赞数

文章标签： tensorflow 分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liuzk2014/article/details/124486076

版权

GPU设置
- 默认用全部GPU并且内存全部占满
- 避免内存不浪费
  - 内存自增长
  - 虚拟设备机制
- 多GPU使用
  - 虚拟GPU&实际GPU
  - 手工&分布式
- API列表
  - tf.debugging.set_log_device_placement
  - tf.config.experimental.set_visible_devices
  - tf.config.experfimental.list_logical_devices
  - tf.config.experfimental.list_phyical_devices
  - tf.config.experfimental.set_memory_growth
  - tf.config.experfimental.VirtualDeviceConfiguration
  - tf.config.set_soft_device_placement 自动分配计算资源
分布式策略
- MirroredStrategy
  - 同步式分布式训练
  - 适用于一机多卡
  - 每个GPU都有网络结构的所有参数，这些参数会被同步
  - 数据并行
    - batch数据且为N分给各个GPU
    - 梯度聚合然后更新给各个GPU上的参数
- CentralStorageStrategy
  - 参数不是每个GPU上，而是存储在一个设备上
    - CPU或者唯一的GPU上
  - 计算是在所有GPU上并行的
    - 除了参数计算
- MultiworkerMirroredStrategy
  - 适用于多机多卡的情况
- TPUStrategy
  - 使用在TPU上的策略
- ParameterServerStrategy 参数服务策略
  - 异步分布式
  - 更加适用于大规模分布式系统
  - 机器分为server和worker
- 同步异步的差异
  - 多机多卡
    - 异步可以便面短板效应
  - 一机多卡
    - 同步可以避免过多的通信
  - 异步的计算会增加模型的泛化能力
    - 异步不是严格正确的，所以模型更容忍错误
nvidia相关命令
- nvidia-msi 查看GPU运行情况
- watch -n 0.1 -x nvidia-smi 监控nvidia-smi命令

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【tf2-基础】分布式训练

GPU设置默认用全部GPU并且内存全部占满避免内存不浪费内存自增长虚拟设备机制多GPU使用虚拟GPU&实际GPU手工&分布式API列表tf.debugging.set_log_device_placementtf.config.experimental.set_visible_devicestf.config.experfimental.list_logical_devicestf.config.experfimental.list_phyical_.
复制链接

扫一扫

alexliu2360

CSDN认证博客专家 CSDN认证企业博客

码龄11年

96: 原创

1万+: 周排名

128万+: 总排名

15万+: 访问

: 等级

1601: 积分

2042: 粉丝

54: 获赞

11: 评论

198: 收藏

私信

关注

热门文章

分类专栏

最新评论

【vscode】解决vscode远程连接服务器报错：Downloading VS Code Server failed. Please try again later.
lmw0320: 我执行了你这个wget的命令，提示是系统找不到指定的文件？？这个是从update.code.visualstudio.com上去下载文件？？我不是很理解其中的流程。。另外，我这个远程的服务器，无法连接外网，会受到影响么？
【Linux-运维】解决windows虚拟机centos 7 ssh连接不上的问题
炎忆寒: 好家伙，我搞了半天竟然是这个原因！不知道是不是我理解有问题，其他教程好多都写出来的意思是：CentOS的ip要和vmnet8的ip设成一样的。坑死了！
【vscode】解决vscode远程连接服务器报错：Downloading VS Code Server failed. Please try again later.
alexliu2360: 不需要
【vscode】解决vscode远程连接服务器报错：Downloading VS Code Server failed. Please try again later.
Zehui-Lin: (7) tar -zxvf vscode-server.tar.gz -C ./ 需要加-C吧？
【flask-进阶】Celery架构和结构分析图
北风之神c: 写得赞，博主用心了，但主要还是celery太难用了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字，所以网上的celery博客教程虽然很多，但是并不能学会使用，因为要运行起来需要以下6个方面都掌握好，博客文字很难表达清楚或者没有写全面以下6个方面。 celery消费任务不执行或者报错NotRegistered，与很多方面有关系，如果要别人排错，至少要发以下6方面的截图，因为与一下6点关系很大。 1) 整个项目目录结构,celery的目录结构和任务函数位置，有很大影响 2) @task入参 ,用户有没有主动设置装饰器的入参 name,设置了和没设置有很大不同，建议主动设置这个名字对函数名字和所处位置依赖减小 3) celery的配置，task_queues(在3.xx叫 CELERY_QUEUES )和task_routes (在3.xx叫 task_routes) 4) celery的配置 include （在3.xx叫 CELERY_INCLUDE）或者 imports (3.xx CELERY_IMPORTS) 或者 app.autodiscover_tasks的入参 5) cmd命令行启动参数 --queues= 的值 6) 用户在启动cmd命令行时候，用户所在的文件夹。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 https://function-scheduling-distributed-framework.readthedocs.io/zh_CN/latest/index.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等19个方面全方位超过celery，任何方面都是有过之而无不及。发布性能提高1000%，消费性能提高2000%

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。