- 博客(3)
- 收藏
- 关注
原创 使用Bert的预训练模型和toknizer做下游任务模型,训练速度慢,发现是数据加载的问题,解决方案
问题就出现在这个加载函数这里,collate_fn的这个函数是在提取出数据时才进行处理,发现在这速度很慢,于是推测是tokenizer的问题,但是单独拿出来发现速度并不慢。最后发现是因为上传的dataset使用了datasets包生成的dataset,最后使用遍历生成list结构的dataset。最后要注意生成的loader数据加载器的数据类型需要是张量,这里我在collate_fn函数中做了转换,如果不使用collate_fn函数的情况下,传入的dataset数据需要是张量。
2024-09-04 13:35:00 186
原创 文本预处理《动手学深度学习》
一个counter是一个dict的子类,用于计数可哈希对象。返回一个(元素,出现次数)对的counter对象。当不指定sep和maxsplit时,默认(sep=None,maxsplit=-1)连续空格被视为分隔符,拆分次数无限制,进行所有可能的拆分。reverse:为一个布尔值,如果设为True,则每个列表元素将按反向顺序比较进行排序。key:指定带有单个参数的函数,用于从iterable中提取用于比较的项。当指定了sep时,连续的分隔符不会被视为一个分隔符组合在一起,而是被视为分隔空字符。
2024-03-21 16:08:25 165 1
原创 李沐《动手学深度学习》锚框
在这里* in_height / in_width很多人不理解(包括我),经过看其他人的评论和自己测试后我发现,是因为文章中的公式有误,导致大家推导代码感觉没有逻辑性。把上面推导过程捋清楚后,这里就不能理解* in_height / in_width,是为了与原图等比例缩放,也就是说当r=1时,使得。所以其实这里代码是没问题的,因为文章中对两个参数的描述不清晰,导致大家不理解。(所以这里的宽高比不是锚框的宽高比,而是锚框的宽高比与原图的宽高比的比值)。,锚框与原图同形,而不是确定锚框为正方形。
2024-03-17 16:20:57 509 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人