gradio简单搭建——关键词简单筛选【2024-4-11优化】

本文介绍如何使用gradio构建一个工具,通过关键词自动标注文本数据,支持单元素或多元素匹配,简化数据标注流程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

gradio简单搭建——关键词简单筛选[2024-4-11 优化]

新的思路:标签自动标注

针对通过关键词,在文本数据中体现出主体的工作类型这一任务,这里使用展示工具gradio制作一个简单的交互平台。在前两天的优化后,我们可以通过无效关键词、单元素/多元素关键词顺序匹配的方式对文本数据进行约束,从而找出符合匹配条件的数据信息,并更加高效地执行下游的标注任务

当对数据信息存在一定程度的了解后,我们可以找出一些针对性极强的关键词,就像上一节描述的低光速黑域一样——“简单、潦草”地看上一眼,就能知道主体的动作、行为大概率描述某一具体工作。例如:

某人对材料进行焊接过程中,不小心被烫伤。

分析:焊接这个词更多是电焊工/焊接工的专业动作;过程中则描述过去正在进行专业动作的状态。这两个词的组合成的关键词,可以极大概率指向电焊工/焊接工这个工种。

但是发现:如果仅仅是查找单元素关键词匹配已经实现了,但标注工作还是要亲自去做。为了减少操作步骤、简化工作量,我们更希望:这类指向性强关键词,直接将对应标签标注上去。这也是本次优化目标

  • 添加一组标注相关的单选框,将单/多元素关键词匹配的查找结果对应的标签信息更新到原始数据中,最终输出完整数据;
  • 给单选框设置默认值,减少greet函数内的判断逻辑。

界面搭建优化

这里并没有强制性地赋予单/多元素匹配单选框默认选项主要因为上一节关于该单选框均为空也可以执行.

import gradio as gr
from file_generator import generate_file

class CONST:
    file_type_list = ['xlsx']

def submit(input_file,
           invalid_task,
           invalid_keyword_input,
           task,
           keyword_input,
           mask_task,
           mask_keyword,
           desc):
    

    print(f'task:{
     task}')
    print(f'keyword_input:{
     keyword_input}')
    print(f'invalid_task:{
     invalid_task}')
    print(f'invalid_keyword_input:{
     invalid_keyword_input}')
    
    # 输入文件格式设置
    if not input_file:
        raise gr.Error('请上传文件')
    
    if '\\' in input_file:
        input_file = input_file.replace('\\','/')
    
    suf = input_file.split('.')[-1]
    
    if suf not in CONST.file_type_list:
        raise gr.Error('不支持的格式:{},请检查文件格式'.format(suf))
    
    # 2024-4-11 优化:添加了无效元素匹配单选框的默认选项,减少一部分判断操作
    if invalid_keyword_input:
        if invalid_task == '禁用':
            raise gr.Error('无效元素匹配[禁用]时,无法输入无效元素') # 选择禁用时,文本框不可用
        else:
            if ',' in
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

静静的喝酒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值