解决:ModuleNotFoundError: No module named ‘tiktoken’


解决:ModuleNotFoundError: No module named ‘tiktoken’





背景

在使用之前的代码时,报错:
Traceback (most recent call last):
File “xxx”, line xx, in
import tiktoken
ModuleNotFoundError: No module named ‘tiktoken’



报错问题


  Traceback (most recent call last): 
    File "xxx", line xx, in  
          import tiktoken 
  ModuleNotFoundError: No module named 'tiktoken'



报错翻译

主要报错信息内容翻译如下所示:


  Traceback (most recent call last): 
    File "xxx", line xx, in  
          import tiktoken 
  ModuleNotFoundError: No module named 'tiktoken'

翻译:


追溯(最近一次通话):
文件“xxx”,第xx行,在
导入tiktoken
ModuleNotFoundError:没有名为“tiktoken”的模块



报错位置代码


...
      import tiktoken 
...



报错原因

经过查阅资料,发现是这个错误通常是由于缺少tiktoken的依赖库,就会出现这样的提示。

小伙伴们按下面的解决方法即可解决!!!



解决方法

要解决这个错误,需要安装tiktoken的依赖库,即可解决。

方法一,直接安装

在window下安装tiktoken

pip install tiktoken

如果你嫌下载慢,可以更改下载源,

比如,利用豆瓣的下载源

pip install tiktoken -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

附,国内各大源列表:

名称地址
阿里https://mirrors.aliyun.com/pypi/simple
豆瓣http://pypi.douban.com/simple/
清华大学https://pypi.tuna.tsinghua.edu.cn/simple
中国科学技术大学https://pypi.mirrors.ustc.edu.cn/simple
华中理工大学http://pypi.hustunique.com/simple
山东理工大学http://pypi.sdutlinux.org/simple
网易https://mirrors.163.com/pypi/simple/
腾讯https://mirrors.cloud.tencent.com/pypi/simple

如果你使用的是conda环境,请尝试使用conda install安装tiktoken。

conda install -c https://conda.anaconda.org/menpo tiktoken

如果你使用的是pip安装tiktoken,可以尝试使用以下命令安装:

pip install --no-cache-dir tiktoken

方法二,手动下载安装

将安装包手动下载到本地进行安装,然后在cmd 中进入安装包的路径下面用:cd +路径,进入。

然后输入以下命令:

pip install tiktoken-0.5.2-cp312-cp312-win_amd64.whl

就可以进行安装了。

附下载链接,点击下载对应版本的dilb链接
https://pypi.org/project/tiktoken/#description

方法三,编译安装

如果上述方法都不能解决问题,你可以尝试从源代码编译安装tiktoken。具体步骤可以参考tiktoken的官方文档。



tiktoken 简介

tiktoken是OpenAI于近期开源的Python第三方模块,该模块主要实现了tokenizer的BPE(Byte pair encoding)算法,并对运行性能做了极大的优化。本文将介绍tiktoken模块的使用。

BPE(Byte pair encoding)算法是NLP中常见的tokenizer方式,关于其介绍和实现原理,读者可参考深入理解NLP Subword算法:BPE、WordPiece、ULM

tiktoken已开源至Github,下图是使用GPT-2 tokenizer在1G文本上进行的性能测试,它会比其它开源的tokenizer库运行快3-6倍。

在这里插入图片描述

Github地址:https://github.com/openai/tiktoken
官方pip:https://pypi.org/search/?q=tiktoken



今天的分享就到此结束了

欢迎点赞评论关注三连

在这里插入图片描述

  • 16
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ninghes

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值