使用魔搭社区的模型对对话文本进行语义分割

最新推荐文章于 2024-05-12 22:50:54 发布

鱼鱼9901

最新推荐文章于 2024-05-12 22:50:54 发布

阅读量264

点赞数 1

分类专栏： nlp 文章标签：自然语言处理人工智能

本文链接：https://blog.csdn.net/weixin_72100405/article/details/136498524

版权

nlp 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

1、对文本进行前处理：

①当文本长度小于512时，填充其长度。经过各种填充的尝试，发现将原对话再续几遍对分割的效果最好：

        while len(inputs) < 512:
            inputs += inputs

②将 “小明：” 替换成 “小明，” 【因为太多的“：”会导致语义分割出错】

2、导入模型，开始分割：

from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

p = pipeline(
    task=Tasks.document_segmentation,
    model='damo/nlp_bert_document-segmentation_chinese-base'
    )

result = p(documents=inputs)

result是一个字典，其中的'text'就是分割后的结果，分割后的段落以‘\t’开始，以'\n‘结束，所以进行后处理如下：

tmp = re.split(r'\n\t', re.sub(r'^\t', '', result['text']))
text = list(filter(None, tmp))

此时text是列表，每一个元素都是一个语义相近的一段，分割结束

优惠劵

鱼鱼9901

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
使用魔搭社区的模型对对话文本进行语义分割

①当文本长度小于512时，填充其长度。②将 “小明：” 替换成 “小明，” 【因为太多的“：”会导致语义分割出错】此时text是列表，每一个元素都是一个语义相近的一段，分割结束。
复制链接

扫一扫

专栏目录

触屏Java游戏触屏游戏魔塔.jar（含截图+源代码）

06-23

易语言魔塔游戏

07-16

易语言魔塔游戏源码,魔塔游戏,对话充填,游戏开始,创建NPC,判断经验,取坐标_x,取坐标_y,创建游戏界面,上楼,置角色坐标,下楼,更新状态,取关键字,处理内容事件,战斗,对话处理,地图入信息,取地图信息,刷新地图信息,置地图信息,置对话信息2,置对话信息3,置对话信息

参与评论您还未登录，请先登录后发表或查看评论

魔塔游戏基础版，使用C语言基础知识实现

08-07

该版本的魔塔游戏项目使用C语言基础的知识进行实现，逻辑较为清晰，C语言入门程序员可参考。包含五个文件，一个主函数（main）、两个封装库，动态数组（.h及.c实现）、mota类库。

Mota_魔塔_

09-30

模仿别人的魔塔flash小游戏写的一个魔塔游戏，只写到了第五层，因为不专业，只是凭兴趣在学习，所以很慢。上传上来给大家看看，有什么建议欢迎提出。。。。

LLM实战 | 基于本地知识库打造属于自己的New Bing！

zyqytsoft的博客

06-11

4019

ChatGPT等LLM大模型的知识延迟问题和幻想问题一直是两个非常难以解决的问题。而其背后的技术选型导致了这两个问题必然会存在。知识延迟：由于大模型的知识来自于训练时喂给它的训练数据，且大模型很难做到实时更新，一般更新一次也得花上好几个月，所有它能接收到的数据必然是延迟的。幻想问题：由于LLM采用的概率模型，即预测生成下一个字符概率是多少，所有或多或少的它在生成结果的时候都有定的可能出现错误。那么如何解决这两个问题呢？目前比较好的方式就是利用大模型极强的语义理解能力，给大模型外挂一个知识库或者搜索引擎。

一文掌握文本语义分割：从朴素切分、Cross-Segment到阿里SeqModel

结构之法算法之道

01-04

6727

之所以写本文，源于以下两点详见，但该系统也有个可选项，可以选择达摩院开源的语义分割模型：nlp_bert_document-segmentation_chinese-base考虑到在RAG中，embedding和文档语义分割、段落分割都是绕不开的关键点，故本文重点梳理下各类典型的语义分割模型。

基于LangChain+LLM的本地知识库问答：从企业单文档问答到批量文档问答

结构之法算法之道

07-05

8万+

本文则侧重讲解 1 什么是LangChain及langchain的整体组成架构 2 解读langchain-ChatGLM项目的关键源码，不只是把它当做一个工具使用，因为对工具的原理更了解，则对工具的使用更顺畅 3 langchain-ChatGLM项目的升级版langchain-chatchat

第一部分什么是LangChain：LLM的外挂/功能库

人工智能曾小健

08-14

2050

DB-GPT基于FastChat 构建大模型运行环境，并提供 vicuna 作为基础的大语言模型。此外，通过LangChain提供私域知识库问答能力，且有统一的数据向量化存储与索引：提供一种统一的方式来存储和索引各种数据类型，同时支持插件模式，在设计上原生支持Auto-GPT插件，具备以下功能或能力根据自然语言对话生成分析图表、生成SQL与数据库元数据信息进行对话, 生成准确SQL语句与数据对话, 直接查看执行结果。

NLP 中的语言模型预训练&微调

CLOUD

12-13

1万+

1 引言语言模型（Language Model），语言模型简单来说就是一串词序列的概率分布。具体来说，语言模型的作用是为一个长度为m的文本确定一个概率分布P，表示这段文本存在的可能性。在实践中，如果文本的长度较长，P(wi | w1, w2, . . . , wi−1)的估算会非常困难。因此，研究者们提出使用一个简化模型：n元模型（n-gram model）。在 n 元模型中估算条件概率...

魔塔命令下载的模型路径

Aorg1的博客

12-07

440

这一层是模型的发布者名字。

C语言魔塔游戏基础核心架构（使用C语言实现多态）

07-28

文件主要包括：Broad.c、Broad.h、Hero.c、Hero.h、main7.28.c、Manager.c、Manager.h、Wall.c、架构核心思想.png。已实现功能：英雄移动、墙及英雄...主要使用知识：结构体、函数指针（二级指针）、void*、void**等。

环境配置 | 有关NLP的库安装学习使用示例，原理解释及出错解析

weixin_44649780的博客

11-11

1388

Python和Cython中的高级自然语言处理库，它建立在最新的研究基础之上，从一开始就设计用于实际产品。spaCy带有预先训练的统计模型和单词向量，目前支持。它具有世界上速度最快的句法分析器，用于标签的卷积神经网络模型，解析和命名实体识别以及与深度学习整合。它是在MIT许可下发布的商业开源软件。【1】

【技术分享】BERT系列（二）-- BERT在序列标注上的应用

qq_42933419的博客

11-06

3036

本文原作者：梁源，经授权后发布。原文链接：https://cloud.tencent.com/developer/article/1454904 序列标注是NLP中一项重要的任务，它主要包括分词，词性标注，命名实体识别等子任务。通过对预训练后的BERT模型进行finetune，并与CRF进行结合，可以很好地解决序列标注问题。上篇文章对BERT官方源码进行了介绍，本篇文章将介绍如何通过BE...

[NLP自然语言处理]谷歌BERT模型深度解析

最新发布

vivi_cin的博客

05-12

159

【代码】bert 的MLM框架任务。

使用pygame实现一个魔塔游戏

05-09

好的，我可以给你提供一个大概的框架，你可以根据需要进行修改和完善。首先，需要导入pygame库和其他必要的库： ```python import pygame import random import time import os import sys ``` 然后，需要初始化pygame和设置游戏窗口的大小： ```python pygame.init() size = width, height = 640, 480 screen = pygame.display.set_mode(size) ``` 接下来，可以定义一些游戏中会使用到的常量： ```python # 窗口标题 pygame.display.set_caption("魔塔游戏") # 定义颜色 BLACK = (0, 0, 0) WHITE = (255, 255, 255) RED = (255, 0, 0) GREEN = (0, 255, 0) BLUE = (0, 0, 255) # 游戏状态常量 START = 0 PLAYING = 1 END = 2 # 精灵类别常量 WALL = 0 PLAYER = 1 MONSTER = 2 TREASURE = 3 ``` 然后，可以定义一些游戏中会使用到的类，例如地图、精灵、角色等： ```python class Map(): def __init__(self, level): # 读取地图数据 self.map_data = self.load_map(level) def load_map(self, level): # 读取地图数据，可以根据需要从文件中读取 pass def draw(self, screen): # 绘制地图 pass def get_cell(self, x, y): # 获取指定位置的单元格 pass class Sprite(pygame.sprite.Sprite): def __init__(self, x, y, image_file): pygame.sprite.Sprite.__init__(self) self.image = pygame.image.load(image_file).convert_alpha() self.rect = self.image.get_rect() self.rect.x = x self.rect.y = y class Player(Sprite): def __init__(self, x, y): Sprite.__init__(self, x, y, "player.png") self.hp = 100 self.attack = 10 self.defense = 10 self.gold = 0 def move(self, map, dx, dy): # 移动角色 pass class Monster(Sprite): def __init__(self, x, y, monster_type): Sprite.__init__(self, x, y, "monster{}.png".format(monster_type)) self.hp = random.randint(50, 100) self.attack = random.randint(5, 10) self.defense = random.randint(5, 10) self.gold = random.randint(10, 20) class Treasure(Sprite): def __init__(self, x, y, treasure_type): Sprite.__init__(self, x, y, "treasure{}.png".format(treasure_type)) self.gold = random.randint(10, 20) ``` 接下来，可以定义一些游戏中会使用到的函数，例如绘制文本、处理输入事件等： ```python def draw_text(screen, text, size, x, y): # 绘制文本 pass def handle_input(player, map): # 处理输入事件 pass def show_message(screen, message): # 显示消息 pass def show_status(screen, player): # 显示角色状态 pass def battle(player, monster): # 处理战斗事件 pass def get_treasure(player, treasure): # 处理获得宝物事件 pass ``` 最后，可以在游戏主循环中调用上述函数，实现游戏的整体逻辑： ```python def main(): # 初始化游戏状态 game_state = START level = 1 map = Map(level) player = Player(0, 0) monsters = pygame.sprite.Group() treasures = pygame.sprite.Group() # 游戏主循环 while True: # 处理输入事件 handle_input(player, map) # 绘制背景 screen.fill(BLACK) # 绘制地图 map.draw(screen) # 绘制角色 player.draw(screen) # 绘制怪物 monsters.draw(screen) # 绘制宝物 treasures.draw(screen) # 显示角色状态 show_status(screen, player) # 更新屏幕 pygame.display.flip() # 判断游戏状态 if game_state == START: # 显示开始界面 pass elif game_state == PLAYING: # 处理游戏中的事件 pass elif game_state == END: # 显示游戏结束界面 pass # 控制帧率 pygame.time.Clock().tick(60) if __name__ == "__main__": main() pygame.quit() sys.exit() ``` 以上是一个简单的魔塔游戏的实现框架，你可以根据自己的需求进行修改和完善。

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交