PyText基于PyTorch进行语言识别

Facebook已将其PyText项目开源,该项目是一种用于自然语言处理(NLP)的机器学习库,旨在使实验项目和生产系统的组合变得更加容易。

PyText建立在Facebook现有的PyTorch库中,用于机器学习,并由公司内部使用。PyText的创建目的是解决如何使用神经网络(例如用于NLP)进行机器学习。 他们在帖子中说,这样的库通常是“在针对实验优化的框架和针对生产优化的框架之间的权衡”。

[避免机器学习失败: 使机器学习失败的6种方法 机器学习课程:5家公司分享了他们的错误 ]

Facebook的工程师写道,为实验而构建的框架允许快速进行原型制作,但遭受“增加的延迟和生产中的内存使用”的困扰。 另一方面,为生产而构建的框架在负载下工作得更好,但很难快速开发。

PyText的主要不同之处在于其工作流程,Facebook声称可以针对实验或生产用途对其进行优化。 可以将框架的组件缝合在一起以创建整个NLP管道,或者可以分解各个部分并在其他情况下重新使用。

训练新模型可以分布在多个节点上,并且可以同时训练多个模型。 PyText还可以使用许多现有模型进行文本分类,从而在这些情况下完全无需培训。

PyText还通过上下文模型提高了理解能力,这是一种丰富模型对先前输入中文本的理解的方式。 例如,聊天机器人可以在讨论中重用先前消息中的信息来确定其答案。

PyText的一项功能显示了Python驱动的机器学习系统如何找到避免可能因语言而出现的性能问题的方法。 可以以优化的ONNX格式导出PyText模型,以便使用Caffe2快速推断。 这样,推理过程就不受Python运行时的限制,但是Python仍用于组装管道和编排模型训练。

PyTorch本身最近获得了正式的1.0版发行,其自身的功能旨在加速训练和推理,而不受Python的限制。 其中之一,Torch Script,可以及时编译Python代码以加快其执行速度,但它只能与该语言的子集一起使用。

Facebook的工程师说,PyText的近期计划包括“支持多语言建模和其他建模功能,使模型更易于调试,并为分布式培训增加更多的优化”。

From: https://www.infoworld.com/article/3328543/pytext-builds-on-pytorch-for-language-recognition.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值