人工智能技术助力民族语言保护大有可为

当前,随着经济、文化互动的全球化,主流或通用语言更加强势,弱势语言正濒临消亡。目前世界上大约有7000种语言,而据语言学家预测大部分将于本世纪末消失。如果一种语言消失了,与之对应的整个文明也将随之灭亡;如不及时对弱势语言采取措施,我们将失去对人类文化遗产完整记录的机会。

众所周知,语言是人类进行沟通交流的主要表达方式,也是文化的载体和重要表现形式,还是一个民族的血脉和精神家园。因此,民族语言(母语),尤其是少数民族语言的保护已经成为一项重要而迫切的工作,而这方面的工作大有可为。

中国著名学者周海中先生曾经指出:当今处于弱势的民族语言正面临着强势语言、全球化、互联网等的冲击,其社会使用功能正处于逐渐弱化或消失的危险境地;保护民族语言,有利于人类文明的传承和发展,也有利于民族团结、社会安定。

保护语言多样性就是保护文化多样性,而保护文化多样性也是保护人类命运共同体的多样性。可以说,民族语言不仅是民族存在的很重要的特征之一,也是民族文化传承、发展、繁荣的重要载体,更是人类文明进步和社会和谐稳定的重要标志。

如今,人工智能(AI)在人们看来已经不再陌生了,大家都已亲身感受到它对我们日常生活的影响:人脸识别、语音控制、无人驾驶、智能家居、智能机器服务等;但是其实,人工智能的使命远远不只是方便人类,更是守护地球文明。

在濒危语言方面,语言记录很大程度依赖人工,然而其结构复杂多变,想要归纳完整的语音变化、语义分析、语法分析等,单靠人力是不现实的。另外,被研究语言的采集、文本转写缺乏规范也存在许多具体困难。

目前,人们正在利用人工智能技术系统地研究濒危语言,实现对其完整的记录。人工智能技术可建立完善的语料库,记录内容包括:确定该语言的语音结构,分析该语言的句法结构,基本意义单位和主流语言的对应关系等。

运用语音识别、语音转写、语音合成等人工智能技术,口音与文字可以更好结合,实现濒危语言的的语音输入。如此一来,即使没有文字的濒危语言,也有条件转换成主流语言文本,得以记录与传承。

前不久,美国著名未来学家托马斯·弗雷先生提出了“全球语言档案馆”的设想;在那里,他利用了人工智能技术把不同的民族语言以视频、音频和书面文件的方式存档。他目前已经联合世界各地的学者收集了近4000种语言的数据,其中许多是濒危语种。

弗雷先生将收集到的语言资料输入到人工智能语言重建引擎,其能够生成一个功能性的三维立体化身,将语言传授给想要学习它的人。他表示,人工智能引擎将更进一步,填补任何语言空白,在需要时创建一种语言的书面形式,并提供语言之间的翻译。

在中国,科大讯飞利用人工智能技术寻找濒危语言中不同尺度的音节语义之间的关联和模式,在超强算力的服务器的协同配合下,最终形成语音库,实现了濒危语言的留存。凭借先进的智能语音技术,该公司覆盖多个少数民族语言及方言的语音系统已经得到实际应用。

中国的阿里巴巴AI Labs最近宣布,正式成立方言保护专项小组,投入1亿元对汉语方言进行保护和开发。他们将以人工智能为技术手段,在全国范围内逐步开展对方言的语音识别、语音合成工作,用科技永久保存方言。

对许多机构来说,维护数字语言数据并使其便于土著社区使用是一项挑战。而加拿大第一民族文化委员会(FPCC)最近为了支持不列颠哥伦比亚省的土著语言、艺术、文化和遗产的复兴,通过其First Voice平台保存语言数据,制作教学程序和应用程序。

另外,First Voice的最新创新是一款键盘应用程序,可让用户在移动设备上输入超过100种当地语言,包括社交媒体、电子邮件和文字处理。First Voices将其语言数据存储在Nuxeo中,Nuxeo是一个开源的云本地内容服务引擎,集成了人工智能和机器学习。

澳大利亚ARC语言动态卓越中心(CoEDL)为了向生活在偏远社区的儿童教授澳大利亚的土著语言,还开发了一种低成本、易于运输的智能机器人Opie。当孩子们通过故事、游戏和课程学习时,Opie的眼睛会与他们互动,机器人会记录下他们的语言技能,供老师跟踪他们的学习情况。

另外,CoEDL与美国谷歌合作,为土著语言转录和构建人工智能模型,他们目前已经为20多种澳大利亚土著语言建立了人工智能模型。这要归功于谷歌的开源人工智能平台TensorFlow;这种机器学习技术为语言学家节省了数百万个小时的时间来转录CoEDL超过4万小时的录音。

由于人工智能技术在语言存储和学习方面的优势,现在它在拯救濒危语言的过程中变得空前重要。不过,想通过这一技术使这些语言得以保护还面临很大的挑战,例如许多土著语言一般是通过口述的方式进行传承,如果将其转化为文字,可能会改变或者无法完整地表达其原本含义。

我们完全可以相信,在现代科技,尤其是人工智能技术的助力下,民族语言的保护问题一定能够得以解决。最后,笔者希望有越来越多的人和机构参与民族语言的保护工作,为建设语言生态文明和保护世界文化多样性贡献智慧和力量。

【编辑推荐】

  1. 企业现在需要采用的三大数据连续性技术
  2. 研究表明人工智能如何在手术后帮助减少阿片类药物的使用
  3. 人工智能、机器学习和深度学习做好准备的数据中心
  4. 5G车联网技术驱动自动驾驶智慧化变革之路
  5. 后端程序员必备技术栈,消息队列的作用是什么
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SQLAlchemy 是一个 SQL 工具包和对象关系映射(ORM)库,用于 Python 编程语言。它提供了一个高级的 SQL 工具和对象关系映射工具,允许开发者以 Python 类和对象的形式操作数据库,而无需编写大量的 SQL 语句。SQLAlchemy 建立在 DBAPI 之上,支持多种数据库后端,如 SQLite, MySQL, PostgreSQL 等。 SQLAlchemy 的核心功能: 对象关系映射(ORM): SQLAlchemy 允许开发者使用 Python 类来表示数据库表,使用类的实例表示表中的行。 开发者可以定义类之间的关系(如一对多、多对多),SQLAlchemy 会自动处理这些关系在数据库中的映射。 通过 ORM,开发者可以像操作 Python 对象一样操作数据库,这大大简化了数据库操作的复杂性。 表达式语言: SQLAlchemy 提供了一个丰富的 SQL 表达式语言,允许开发者以 Python 表达式的方式编写复杂的 SQL 查询。 表达式语言提供了对 SQL 语句的灵活控制,同时保持了代码的可读性和可维护性。 数据库引擎和连接池: SQLAlchemy 支持多种数据库后端,并且为每种后端提供了对应的数据库引擎。 它还提供了连接池管理功能,以优化数据库连接的创建、使用和释放。 会话管理: SQLAlchemy 使用会话(Session)来管理对象的持久化状态。 会话提供了一个工作单元(unit of work)和身份映射(identity map)的概念,使得对象的状态管理和查询更加高效。 事件系统: SQLAlchemy 提供了一个事件系统,允许开发者在 ORM 的各个生命周期阶段插入自定义的钩子函数。 这使得开发者可以在对象加载、修改、删除等操作时执行额外的逻辑。
SQLAlchemy 是一个 SQL 工具包和对象关系映射(ORM)库,用于 Python 编程语言。它提供了一个高级的 SQL 工具和对象关系映射工具,允许开发者以 Python 类和对象的形式操作数据库,而无需编写大量的 SQL 语句。SQLAlchemy 建立在 DBAPI 之上,支持多种数据库后端,如 SQLite, MySQL, PostgreSQL 等。 SQLAlchemy 的核心功能: 对象关系映射(ORM): SQLAlchemy 允许开发者使用 Python 类来表示数据库表,使用类的实例表示表中的行。 开发者可以定义类之间的关系(如一对多、多对多),SQLAlchemy 会自动处理这些关系在数据库中的映射。 通过 ORM,开发者可以像操作 Python 对象一样操作数据库,这大大简化了数据库操作的复杂性。 表达式语言: SQLAlchemy 提供了一个丰富的 SQL 表达式语言,允许开发者以 Python 表达式的方式编写复杂的 SQL 查询。 表达式语言提供了对 SQL 语句的灵活控制,同时保持了代码的可读性和可维护性。 数据库引擎和连接池: SQLAlchemy 支持多种数据库后端,并且为每种后端提供了对应的数据库引擎。 它还提供了连接池管理功能,以优化数据库连接的创建、使用和释放。 会话管理: SQLAlchemy 使用会话(Session)来管理对象的持久化状态。 会话提供了一个工作单元(unit of work)和身份映射(identity map)的概念,使得对象的状态管理和查询更加高效。 事件系统: SQLAlchemy 提供了一个事件系统,允许开发者在 ORM 的各个生命周期阶段插入自定义的钩子函数。 这使得开发者可以在对象加载、修改、删除等操作时执行额外的逻辑。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值