一、先把leaf数据集下载下来,然后拖到虚拟机里面。移动文件位置
解压文件,下载解压命令unzip
解压文件
二、环境配置
安装python(自带)以及pip3
根据requirements.txt下载所需要的包:
使用pip命令报错:
然后就可以在虚拟环境中,下载包啦
不用一个一个下载,直接使用“pip3 install -r requirements.txt”就能把文件中的包都下载下来。
下载的时候会报错,但是pip3换源(因为下载的可能是国外的,不好下;换成国内的就好了)
下载tensorflow会报错,因为没有requirement中说的那个版本。那就进入文件把版本信息删掉在下载就好了。
但是报错了:
下载的高版本
换了好几个版本都不行,猜测是某个东西的版本不行。要么,就是numpy要求文档中让下载1.16版本,但是我之前手动下载了1.25,而且也找不到1.16,就报错了。
直接按照文档中要求运行,输入“./preprocess.sh -s niid --sf 0.05 -k 0 -t sample”,划分这个小点的数据集,尝试一下。
昨天电脑息屏中断了,今天重新开始
(1)使用 sudo su管理员进行运行
(2)创建一个虚拟环境
(3)使用“vim”命令编辑requirements.txt文件,把版本信息都去掉
(4)进入到相应目录。重新执行“pip3 install -r requirements.txt”。】
(5) 进入到数据集目录下,执行“./preprocess.sh -s niid --sf 0.05 -k 0 -t sample”重新尝试
出现了错误,原来是要把上次弄的都删除
还是不行,说是运行空间不足了 那想办法扩容。
参考我的深坑弱智记录:(11条消息) ubuntu虚拟机扩容_小李小李无与伦比的博客-CSDN博客
但是!!!!! 我可以划分小的数据集啊!用“./preprocess.sh -s niid --sf 0.05 -k 500 -t sample”
把客户拥有的样本数量改为500,那么筛选出来的客户就少了
运行中断了昨天,但是文件夹里面已经生成了很多新的东西,不用重新开始了。。从这里开始(不用虚拟空间了)
运行结束
接着执行preprocess里面的内容
然后执行./stats.sh
好像就结束了。。