自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(132)
  • 收藏
  • 关注

原创 方面级别情感分析之四元组预测

quad方面级别情感分析四元组任务是由南京理工大学团队2021年8月的论文(ACL 2021)《Aspect-Category-Opinion-Sentiment Quadruple Extraction with Implicit Aspects and Opinions》首先提出来的,这篇文章他主要的贡献是对方面级情感分析四元组的任务定义, 以及提供了一个公开数据集ACOS,提出了多个基于bert处理四元组任务的baseline。\quad。

2023-08-30 22:32:39 6705

原创 方面级别情感分析介绍

由于细粒度情感分析是由早期的情感分析发展来的, 所有在讲细粒度情感分析之前我们需要要了解一下什么是情感分析。说明: (细粒度情感分析也叫方面级别情感分析, 本文统一称为细粒度情感分析)

2023-08-30 22:31:11 6295

原创 方面级情感分析综述论文&论文+讲解+复现(ABSA)

2022最新方面级别情感分析论文综述:A Survey on Aspect-Based Sentiment Analysis:Tasks, Methods, and Challenges其中关于ASTE-Data-V2数据集的论文1.论文地址1.Towards Generative Aspect-Based Sentiment Analysis ACL20212.Learning Span-Level Interactions for Aspect Sentiment Triplet Extra

2022-04-28 14:59:31 12952 12

原创 【 Nanobot 】nanobot 核心源码解读

anthrpoic官网文档: https://platform.claude.com/docs/en/agents-and-tools/agent-skills/overviewAnthropic将Agent Skills定义为基于大模型的智能体模块化能力单元,核心是通过“能力解耦-按需组合-安全校验”闭环,将大模型的感知、推理、行动等基础能力封装为可复用组件。

2026-05-19 02:04:13 431

原创 【Claude Code Router】 Claude Code 兼容 OpenAI 格式 API, Claude code 接入本地部署模型

Claude Code 是 Anthropic 官方推出的 AI 编程助手 CLI 工具,默认使用 Claude 模型。Claude Code Router 是一个开源的路由工具,允许我们将 Claude Code 的请求转发到其他兼容 OpenAI API 格式的模型服务,实现灵活的模型切换和统一管理。本文将介绍 Claude Code Router 的功能特点,并详细讲解安装配置步骤。

2026-05-02 19:54:43 2320

原创 【CC-Switch】:Claude Code 兼容 OpenAI 格式 API, Claude code 接入本地部署模型

告别手动编辑配置文件— 可视化界面一键切换支持多种 API 格式— Anthropic 格式和 OpenAI 兼容格式都能搞定路由模式— 自动格式转换,兼容更多供应商统一管理— MCP、Skills、Prompts 一站式管理对于经常使用 Claude Code 的开发者,CC-Switch 是提升效率的必备工具。推荐使用路由模式获得更好的兼容性,可以接入 DeepSeek、硅基流动等国内优质模型服务。

2026-05-01 22:29:25 6423 4

原创 【xiaozhi-客户端】xiaozhi-web-client 连接客户端 6位有效码

当服务器启用设备认证时,新设备首次连接需要获取六位验证码进行激活。本项目提供了脚本用于获取验证码。xiaozhi-web-client 提供了一个便捷的Web界面来使用小智语音助手。通过简单的配置,你可以快速启动服务并开始语音对话。配置 .env 文件- 设置服务器地址和端口获取验证码- 如果服务器启用认证,使用获取六位验证码启动服务- 使用 Poetry 或 Docker 运行开始使用- 打开浏览器访问 Web 界面。

2026-04-26 19:24:09 1851

原创 【xiaozhi-esp32-server-服务端全模块启动】 xiaozhi-server 获取6位有效验证码

这里会你自己创建的agent配置,刚进去的时候默认为空。

2026-04-26 18:49:21 1739

原创 【语音相关ASR】FunASR 离线语音识别与FunASR热词优化

FunASR 是阿里巴巴达摩院开源的语音识别工具库,提供了多种模型和丰富的参数配置,支持离线和实时语音识别。在查阅 FunASR 热词功能相关资料时,发现网络上关于本文将从 FunASR 的基础功能出发,重点介绍的完整实现,并提供所有可运行的代码示例,帮助读者快速上手 FunASR 热词优化。

2026-04-12 13:37:59 1868

原创 【python_并发】requests vs aiohttp vs httpx:HTTP客户端深度对比与实战

单次请求:简单脚本、配置文件读取非IO密集:计算密集型任务兼容旧代码:迁移成本考虑调试阶段:同步代码更容易调试# 简单脚本用 requests 最方便场景同步耗时异步耗时提升10个请求(串行)~5秒~0.5秒10倍100个请求(并发10)~50秒~5秒10倍单次请求~0.5秒~0.5秒无差异结论单次请求:同步和异步性能相同批量请求:异步性能提升N倍(N为并发数)异步的优势在于等待IO时可以做其他事,不是单次请求更快。

2026-04-11 18:26:11 1771

原创 【语音相关ASR】OpenAI 兼容 Qwen_ASR 接口调用实战:SDK 与 HTTP 方式详解 / Qwen_ASR 热词支持

格式本地 completions本地 transcriptions阿里云 OpenAI 兼容阿里云异步转写base64 编码✅❌✅❌WAV 文件❌✅❌❌URL 形式✅❌✅✅(必须)PCM 数据❓❓❓❌说明接口需要 base64 编码或 URL接口直接传文件对象阿里云异步转写必须提供 OSS URL。

2026-04-08 22:57:59 2829

原创 【语音相关ASR】FunASR 实时流式语音识别之paraformer-zh-streaming

FunASR 是阿里巴巴达摩院开源的语音识别工具包,旨在 bridging 学术研究与工业应用之间的鸿沟。它基于 PyTorch 构建,提供从模型训练到推理部署的完整解决方案。丰富的预训练模型:涵盖语音识别(ASR)、语音活动检测(VAD)、语音分离、标点恢复等多种任务工业级性能:经过阿里巴巴集团大规模生产环境验证灵活的架构:支持自定义模型、数据集和训练流程中文优化:对中文语音识别场景做了深度优化维度离线推理实时推理延迟高(等待完整音频)低(毫秒级响应)精度较高(完整上下文)

2026-04-04 11:50:36 2318 1

原创 【语音相关】Opus编码器生命周期管理:从“有噪音“到“无噪音“的完美转换 [opus, pcm 转化电流音问题解决]

✅ 正确做法# ❌ 错误做法。

2026-04-02 21:57:24 1680

原创 [agent memory] Diagnosing Retrieval vs. Utilization Bottlenecks in LLM Agent Memory

这篇研究为LLM Agent记忆系统的研发踩下了“刹车”——让研究者和工程师从“为了复杂而复杂”的写入策略设计中抽离,重新聚焦于记忆系统的核心需求:把正确的信息,在正确的时间,检索到模型面前。在大模型技术快速迭代的今天,这样的“诊断性研究”尤为珍贵:它不追求新的模型或新的策略,而是通过严谨的实验拆解核心问题,为后续研发指明方向,避免行业在无效的方向上浪费资源。

2026-03-16 00:49:20 1641

原创 python 迭代器和生成器

迭代器是一个实现了迭代器协议__iter__():返回迭代器自身(必须);__next__():返回序列中的下一个元素;若无更多元素,抛出异常。通过类实现__iter__()和__next__()self.current = start # 当前迭代值self.end = end # 迭代终止条件return self # 必须返回迭代器对象本身raise StopIteration # 无元素时抛出异常,终止迭代return res# 使用迭代器。

2025-11-12 15:43:02 2154

原创 python 多进程、多线程,异步

Python 中的多线程(Multithreading)是一种并发编程技术,允许程序在同一进程中同时运行多个“线程”(轻量级的执行单元),从而提高 I/O 密集型任务的效率。Python 多进程是 利用操作系统的多进程机制,并行执行多个独立任务 的编程方式,核心解决 CPU 密集型任务 的性能瓶颈(如计算、数据分析),也能规避 Python 全局解释器锁(GIL)对 CPU 并行的限制。多进程的本质是:操作系统为每个进程分配独立的内存空间、Python 解释器和 GIL,进程间完全隔离,可真正并行执行。

2025-11-10 14:18:09 2122

原创 BaseEventLoop.create_connection() got an unexpected keyword argument ‘extra_headers‘

本文分析了小智开源项目中WebSocket连接问题,指出客户端(WebSocket v12.0)与服务端(v14.2)版本不兼容导致"extra_headers"参数错误。通过对比源码发现v14.2使用"additional_headers"而非v12.0的"extra_headers"。解决方案是将客户端连接参数从"extra_headers"改为"additional_headers"即可实现版本兼容。

2025-10-28 16:06:37 1885

原创 AGENT KB: Leveraging Cross-Domain Experience for Agentic Problem Solving

当前的人工智能代理无法有效地从彼此的问题解决经验中学习,或利用过去的成功来指导新任务中的自我反思和错误纠正。我们引入了AGENT KB,这是一个共享的知识库,它捕捉了高级问题解决策略和详细的执行经验教训,使得跨代理框架的知识转移成为可能。Agent KB实现了一种新颖的师生双阶段检索机制,学生代理检索工作流级别的模式以获得战略指导,而教师代理识别执行级别的模式以进行细化。这种层次化方法使代理能够通过整合外部来源的多样化策略来打破有限的推理路径。

2025-10-14 16:08:37 1851

原创 playwright 翻页操作,悬浮操作

利用playwright控制B站搜索进行下一个操作,知道下一页没有为止。b站页面悬停、然后点击操作。

2025-09-02 21:41:53 1611

原创 LangGraph 多智能体

单个智能体可能难以应对需要专门处理多个领域或管理多种工具的情况。为了解决这个问题,您可以将智能体分解为更小、独立的智能体,并将它们组合成一个多智能体系统。在多智能体系统中,智能体之间需要进行通信。它们通过移交来实现这一点——这是一种描述将控制权移交给哪个智能体以及发送给该智能体的数据负载的原始操作。两种最受欢迎的多智能体架构是:主管——单个智能体由一个中央主管智能体协调。主管控制所有通信流和任务委派,根据当前上下文和任务要求决定调用哪个智能体。群组。

2025-08-28 15:43:30 2389

原创 python 异步

异步编程主要关注的是并发(Concurrency),而不是并行。它通过单线程中的事件循环来管理多个任务,这些任务在等待 I/O 操作时可以暂停执行,让其他任务继续运行。虽然异步编程可以提高程序的响应能力和资源利用率,但它本身并不实现真正的并行。

2025-08-15 00:54:47 1946

原创 python logger冗余日志处理

在for循环中创建logger日志,产生冗余日志。

2024-08-18 00:02:40 1476 1

原创 Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction

方面情感四元组预测(ASQP)旨在为给定的评论预测所有的四元组(方面术语、方面类别、观点术语、情感极性),这是基于方面的情感分析中最具代表性且最具挑战性的任务。ASQP任务的一个关键挑战是标注数据的稀缺性,这限制了现有方法的性能。为了解决这一问题,我们提出了一个带有伪标签评分器的自训练框架,其中评分器评估评论与其伪标签之间的匹配程度,旨在过滤掉不匹配的部分,从而提高自训练的效果。我们强调了两个关键方面,以确保评分器的有效性和可靠性:训练数据集的质量及其模型架构。为此,我们创建了一个人工标注的对比数据集。

2024-08-17 17:45:28 2841 4

原创 报错: USER_AGENT environment variable not set, consider setting it to identify your requests.

你可以通过设置USER_AGENT环境变量来解决这个问题。以下是如何在不同环境下设置USER_AGENT。

2024-08-16 14:53:24 8208 1

原创 BvSP_ Broad-view Soft Prompting for Few-Shot Aspect Sentiment Quad Prediction

方面情感四元组预测(ASQP)旨在预测基于方面的四个元素,包括方面词、观点词、方面类别和情感极性。在实际应用中,由于数据分布的差异,未见过的方面会给已训练的神经模型带来许多挑战。受此启发,本研究将 ASQP 任务引入少样本场景,旨在实际应用中实现快速适应。因此,我们首先构建了一个少样本 ASQP 数据集(FSQP),该数据集包含更丰富的类别,并且在少样本研究中更加平衡。此外,近期的方法通过生成范式提取四元组,这涉及将输入句子转换为模板化的目标序列。然而,它们主要集中在单一模板的使用或不同模板顺序的考虑上。

2024-08-15 18:38:09 2597 1

原创 All in One: An Empirical Study of GPT for Few-Shot Aspect-Based Sentiment Anlaysis

基于方面的情感分析(ABSA)是自然语言处理领域中不可或缺且极具挑战性的任务。目前的研究主要集中在特定子任务上,因此难以全面涵盖ABSA领域内的所有子任务。随着生成式预训练变换器(GPTs)的发展,为情感分析提供了一体化解决方案的灵感应运而生。在本研究中,我们使用GPTs来处理少样本ABSA的所有子任务,同时为该应用定义了一般学习范式。我们提出了一种名为All in One(AiO)的模型,这是一种简单而有效的两阶段模型,能够处理所有ABSA子任务。

2024-08-11 14:28:37 2482

原创 **kwargs 字典解包传参的方式

在Python中,****kwargs**是一种通过字典解包 (dictionary unpacking) 的方式进行参数传递的方式。它将一个字典的键值对解包并传递给函数的命名参数。

2024-07-07 13:40:37 2045

原创 合并单元格的excel文件转换成json数据格式

【代码】合并单元格的excel文件转换成json数据格式。

2024-04-09 16:12:35 2698

原创 ModuleNotFoundError: No module named ‘half_json‘

问题: ModuleNotFoundError: No module named ‘half_json’解决方法: pip install jsonfixer。

2024-01-25 12:16:50 1969

原创 TypeError: ‘set‘ object is not subscriptable

merged_ranges = sheet_.merged_cell_ranges # 获取当前工作表的所有合并区域列表。

2024-01-11 00:47:34 2608

原创 句子/文本向量化的三种表示方法

这里是利用last_hidden_state的mean进行表示 但这个表示如果利用批量文本向量化的时候可能会出现问题,因为mean的时候会考虑padding, cls_embedding, 和pool_embedding就不会出现这种情况。

2023-11-19 19:07:03 2465

原创 数据处理文件相互转化

这里主要整理的是.txt.json.csv.excel.pkl文件之间的数据存储和转化。

2023-11-12 13:26:25 1960

原创 数组的初始化以及拷贝

使用场景: 备份, 或者是回溯题目的时候需要深拷贝数组, 如果是浅拷贝的化那么将会为[]数组。

2023-10-23 15:31:18 1443

原创 On the Strength of Sequence Labeling and Generative Modelsfor Aspect Sentiment Triplet Extraction

生成模型在方面情感三元组抽取任务中取得了很大的成功。然而,现有的方法忽略了方面词和意见词之间的相互信息线索,可能会产生错误的三元组对。此外,生成模型固有的局限性,即逐个标记的解码和简单的结构化提示,使得模型无法处理复杂的结构,特别是多个单词跨度的术语和多个三元组的句子。为了解决这些问题,我们提出了一个序列标记增强生成模型。首先,我们将aspect和opinion之间的依赖关系编码到两个双向模板中,以避免错误配对的三元组。

2023-09-10 00:29:54 1969

原创 代码随想录刷题笔记 (python版本) 持续更新.....

代码随想录刷题笔记

2023-08-28 17:53:06 11282

原创 八大排序算法 (python版本)

冒泡排序、插入排序、归并排序、计数排序。

2023-08-27 17:23:53 2160

原创 A Fine-Grained Social Bias Measurement Framework for Open-Domain Dialogue Systems (NLPCC 2022)

基于大规模语料库的预训练模型可以有效地提高开放域对话系统在性能方面的性能。然而,最近的研究表明,在预先训练的模型中存在各种道德问题,严重影响了对话系统的应用。在这些伦理问题中,社会偏见特别复杂,因为它对边缘化群体的负面影响往往是隐性的,因此需要规范推理和严格分析。在本文中,我们报告了团队BERT 4 EVER为NLPCC 2022共享任务7 -细粒度对话社会偏见测量提供的解决方案,该任务旨在测量对话场景中的社会偏见。

2023-08-22 18:22:41 1625

原创 An Effective Deployment of Contrastive Learning in Multi-label Text Classification (ACL2023)

对比学习技术在自然语言处理任务中的有效性还有待探索和分析。如何正确合理地构建正反样本是对比学习的核心挑战。在多标签文本分类任务中发现对比对象甚至更难。以前的工作中提出很少提出对比损失。在本文中,我们从一个不同的角度研究这个问题,提出了五个新的对比损失的多标签文本分类任务。分别是严格对比损失(SCL)标签内对比损失(ICL)Jaccard相似性对比损失(JSCL)Jaccard相似性概率对比损失(JSPCL)逐步标签对比损失(SLCL)。

2023-08-22 16:48:02 1877

原创 A Unified One-Step Solution for Aspect Sentiment Quad Prediction (2023 ACL) 文献阅读

方面情感四元预测(ASQP)是一个具有挑战性的任务。是基于方面级别情感分析的重要子任务,因为它提供了一个完整的方面级的情感结构。我们构建了两个数据集1来扩展现有ASQP数据集的容量。表2:ASQP任务的数据统计。#表示对应元件的数量。s、w、c、q分别代表样本、词、类别和四元组。EA、EO、IA和IO分别表示显性方面、显性意见、隐性方面和隐性意见。“-”表示不包括此项目。

2023-07-27 14:29:38 1910

原创 Dual Graph Convolutional Networks for Aspect-based Sentiment Analysis 论文阅读

基于方面的情感分析是一个细粒度的情感分类任务。图1:一个例句及其依赖关系树,来自餐厅评论。这句话包含两个方面,但具有相反的情感极性。图2提供了DualGCN的概述。在ABSA任务中,给出句子-方面对sa(s,a)sa,其中aa1a2amaa1​a2​...am​是一个方面集合。它也是整个句子sw1w2wnsw1w2wn一个子序列。然后,我们使用BiLSTMBiLSTMBiLSTM或BERTBERT。

2023-07-26 21:24:12 3473 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除