【solved】OverflowError: Python int too large to convert to C long.

最新推荐文章于 2025-04-24 19:54:05 发布

cx元

最新推荐文章于 2025-04-24 19:54:05 发布

阅读量7.2k

点赞数 2

分类专栏： Python 文章标签： python 深度学习 pytorch bug nlp

本文链接：https://blog.csdn.net/qq_45436365/article/details/125928367

版权

Python 专栏收录该内容

8 篇文章

订阅专栏

解决报错OverflowError: Python int too large to convert to C long.

问题描述

问题代码如下：

	TEXT = torchtext.data.Field(sequential=True)
    LABEL = torchtext.data.Field(sequential=False, dtype=torch.long, use_vocab=False)

    #使用TabularDataset方法生成数据集
    # 读取文件生成数据集
    fields = [('label', LABEL), ('comment', TEXT)]
    train, valid, test = TabularDataset.splits(
        path='/root/For+Detecting+sentiment+polarity/lstm/', format='csv',
        train='train_data.csv',
        validation="valid_data.csv",
        test='test_data.csv',
        skip_header=True, fields=fields)

运行时出现报错：

OverflowError: Python int too large to convert to C long.

问题分析：

根据提示可知，是发生了溢出错误，即问题数字超过了系统支持的最大数值表示sys.maxsize：
在这里插入图片描述
但是更换数据集之后还是一样的报错，所以猜想可能是torchtext版本问题。

解决方法：

搜索了很多解决方法，发现，其实有可能是torchtext的版本问题。
最开始报错时使用的torchtext版本好像是0.4.0，降低版本改成0.2.3就不会报错了。
但是版本为0.2.3时torchtext.data.Field不支持dyte参数。
去官网查了一下pytorch和torchtext的对应版本，我的pytorch是1.9，解释器python3.8，对应的torchtext版本为0.10.0，于是又把torchtext更新为0.10.0，此时不会再报错，但是会发现0.10.0版本的torchtext没有Field，其实是放在了别的package里，把所有的torchtext.data改为torchtext.legacy.data就可以了。代码更新如下：

TEXT = torchtext.legacy.data.Field(sequential=True)
    LABEL = torchtext.legacy.data.Field(sequential=False, dtype=torch.long, use_vocab=False)

    #使用TabularDataset方法生成数据集
    # 读取文件生成数据集
    fields = [('label', LABEL), ('comment', TEXT)]
    train, valid, test = TabularDataset.splits(
        path='/root/For+Detecting+sentiment+polarity/lstm/', format='csv',
        train='train_data.csv',
        validation="valid_data.csv",
        test='test_data.csv',
        skip_header=True, fields=fields)

问题解决。