关于使用albert,estimator.train方法训练时
如果出现报错'utf-8' codec can't decode byte 0xd5 in position 174: invalid continuation b
而且无论你怎么换输入输出的文件(编码嘛,第一眼肯定是我io的文件编码和设置对不上了)都不顶用,甚至连这里position和byte的位置都不带变的
检查一下电脑的环境是不是windows,而且启动参数里面的文件路径写的是./xxxxxx/xxxxx
这种形式
如果是的话 就一步到位了——./xxxx
是linux系统的目录表示,window直接文件夹名
就好了
比如ai文件夹的根目录下,model文件夹的pretrain文件夹里存了某个东西,要指定的时候直接–xxxpath model/pretain,不要 --xxxpath ./model/pretrain
就这问题搞了一个下午,还以为是tfRecord的记录格式不对,自己重写了一遍读入数据的方式也没救,最后改了这个才好
不说了 重新换回tfrecord了,自己写的方式这个cpu拉满了gpu不动,捏嘛