Sun_Sherry(停更)
码龄9年
求更新 关注
提问 私信
  • 博客:1,411,865
    社区:167
    1,412,032
    总访问量
  • 270
    原创
  • 676
    粉丝
  • 7
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
加入CSDN时间: 2016-09-15
博客简介:

读万卷书 行万里路

博客描述:
我是人间惆怅客,知君何事泪纵横,断肠声里忆平生(纳兰容若).
查看详细资料
个人成就
  • 获得1,177次点赞
  • 内容获得278次评论
  • 获得5,131次收藏
  • 代码片获得12,927次分享
  • 博客总排名105,298名
  • 原力等级
    原力等级
    7
    原力分
    4,420
    本月获得
    0
创作历程
  • 30篇
    2024年
  • 30篇
    2023年
  • 52篇
    2022年
  • 52篇
    2021年
  • 45篇
    2020年
  • 54篇
    2019年
  • 6篇
    2018年
  • 1篇
    2016年
成就勋章
TA的专栏
  • vue
  • 大语言模型
    10篇
  • Tensorflow
    2篇
  • Torch
  • LangChain
    5篇
  • 自然语言处理
    6篇
  • 区块链
    15篇
  • Hyperledger Fabric
    10篇
  • Go语言
    3篇
  • 机器学习
    39篇
  • PySpark
    16篇
  • 数据清洗
    16篇
  • Kettle工具
    13篇
  • Python
    57篇
  • Tableau
    33篇
  • SQL
    12篇
  • 数据分析
    18篇
  • Echarts
    3篇
  • 读书笔记
    11篇
  • LeetCode
    5篇
  • 爬虫
    6篇

TA关注的专栏 1

TA关注的收藏夹 0

TA关注的社区 4

TA参与的活动 0

创作活动更多

王者杯·14天创作挑战营·第2期

这是一个以写作博客为目的的创作活动,旨在鼓励码龄大于4年的博主们挖掘自己的创作潜能,展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴,那么,快来参加吧!我们一起发掘写作的魅力,书写出属于我们的故事。 注: 1、参赛者可以进入活动群进行交流、分享创作心得,互相鼓励与支持(开卷),答疑及活动群请见https://bbs.csdn.net/topics/619735097 2、文章质量分查询:https://www.csdn.net/qc 我们诚挚邀请你们参加为期14天的创作挑战赛!

57人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

NLP: SBERT介绍及sentence-transformers库的使用

bi-encoder是一种独立编码方式,即输入的两个文本会被分别编码为独立的向量,然后通过计算这两个向量的相似度来判断文本之间的关系。Sentence-BERT(简写SBERT)模型是BERT模型最有趣的变体之一,通过扩展预训练的BERT模型来获得固定长度的句子特征,主要用于句子对分类、计算两个句子之间的相似度任务。三元组网络架构的SBERT模型的任务计算出一个特征,使锚定句和正向句之间的相似度高,锚定句和负向句之间的相似度低。在SBERT中,通过汇聚所有标记的特征来计算整个句子的特征。
原创
发布博客 2024.10.09 ·
2621 阅读 ·
21 点赞 ·
0 评论 ·
20 收藏

FastAPI: websocket的用法及举例

WebSocket 是一种在单个TCP连接上进行全双工通信的协议,允许客户端和服务器之间相互发送数据,而不需要像传统的HTTP请求-响应模型那样频繁建立和断开连接。
原创
发布博客 2024.09.30 ·
1696 阅读 ·
5 点赞 ·
0 评论 ·
11 收藏

NLP:BERT的介绍并使用该模型计算文本相似度

Transformer中的位置编码用于为输入序列中的每个词提供位置信息,以弥补模型中缺少顺序感的缺陷,使模型能够捕捉词汇的相对顺序和位置信息。Transformer中的编码器的作用是提取原句中的特征值。一个编码器的输出作为下一个编码器的输入。
原创
发布博客 2024.09.28 ·
1199 阅读 ·
20 点赞 ·
0 评论 ·
26 收藏

NLP:命名实体识别及案例(Bert微调)

这里使用NER任务中常用的数据集:CoNLL-2003,该数据集最早由 CoNLL(Conference on Computational Natural Language Learning)共享任务发布,广泛应用于自然语言处理中的 NER 任务。该数据集中训练集共14041条,验证集共3250条,测试集共3453。"id": "0",tokens表示文本中的单词。所有的tokens组合起来就是句子的原始文本。NER任务中需要为数据集中的每个单词都会被标注相关的标签。chunk_tags表示短语块标签。
原创
发布博客 2024.09.22 ·
1300 阅读 ·
3 点赞 ·
1 评论 ·
9 收藏

NLP:微调BERT进行文本分类

本篇博客的重点在于BERT的使用。transformers包版本:4.44.2。
原创
发布博客 2024.09.13 ·
1157 阅读 ·
5 点赞 ·
1 评论 ·
9 收藏

Rasa: Rasa Core中的相关概念及用法

与故事一样,规则也是对话管理模型的训练数据。但与故事不同的地方在于,规则可以保证,当某个意图出现时,无论什么样的上下文都能百分百触发某个或多个特定的动作时。所以,规则没有泛化能力。
原创
发布博客 2024.09.11 ·
948 阅读 ·
8 点赞 ·
0 评论 ·
26 收藏

Fabric:关于链码的编写及部署的问题记录

本篇主要记录里在链码的编写及配置过程中遇到的问题及解决方法。
原创
发布博客 2024.08.19 ·
631 阅读 ·
6 点赞 ·
0 评论 ·
5 收藏

LangChain:与RAG相关的模块

本篇博客主要整理LangChain中与RAG(Retrieval-Augmented Generation,即检索增强生成)相关的模块。
原创
发布博客 2024.08.12 ·
624 阅读 ·
4 点赞 ·
0 评论 ·
10 收藏

在Docker中部署Rasa NLU服务

Rasa是一个开源的机器学习框架,专为构建基于文本和语音的对话驱动型自动化智能客服助手而设计。它能够克服传统客服的部分缺陷,提供自然语言理解(Rasa NLU)和对话管理(Rasa Core)两大核心功能。Rasa NLU负责用户意图识别、实体提取等,而Rasa Core则基于对话历史和用户输入,预测并决定下一步的对话动作。
原创
发布博客 2024.08.07 ·
1303 阅读 ·
13 点赞 ·
0 评论 ·
14 收藏

LangChain: Runnable的定义和使用

在LangChain中,Runnable是LangChain中用于定义一个可运行对象的抽象接口。它允许开发者定义任何执行某种操作的逻辑单元,并通过标准化的方法使其能够在更大的系统中无缝协作。
原创
发布博客 2024.07.31 ·
2889 阅读 ·
21 点赞 ·
0 评论 ·
18 收藏

LangChain: Message封装和Prompt封装

本篇博客主要介绍Langchain中的Message和Prompt封装。
原创
发布博客 2024.07.28 ·
2135 阅读 ·
15 点赞 ·
0 评论 ·
11 收藏

FastAPI的简单用法

FastAPI 是一个用于构建高性能Web应用程序和API接口的Python框架。其与flask的最大区别在于:FastAPI基于Starlette和Pydantic,支持异步编程,能够提供高并发和高性能。关于Starlette和Pydantic。
原创
发布博客 2024.07.23 ·
734 阅读 ·
25 点赞 ·
0 评论 ·
13 收藏

Fabric:Fabric-Gateway-Go的使用方法

是Hyperledger Fabric v2.4及更高版本中引入的一项服务,它位于Fabric Peer节点中,通过一个简单的gRPC接口服务于客户端应用。将交易提交逻辑从客户端应用程序中剥离出来,可以减轻开发者的负担,并优化网络流量和安全性。支持的语言有:JavaScript/TypeScript、Java、Go及Python等。这里仅以为例来说明。需要说明一点,与Fabric-SDK相比,不能部署链码,所以在使用开发区块链应用之前,需要先自行完成通道及链码的部署。
原创
发布博客 2024.07.20 ·
1745 阅读 ·
12 点赞 ·
1 评论 ·
25 收藏

利用react和chainlit开发大模型结果人工评测平台

利用LLM的prompt做了个简单的服务推荐助手,依据用户的提问找出合适的服务项目推荐给的用户。为了测评prompt的效果,使用react+chainlit开发了一个简单的效果测评平台。在该平台上,可以模拟用户向LLM发出问题,并对大模型返回的服务项目进行评判。鉴于后端prompt暂时无法公开,这里仅公开前端的react代码,至于后端代码可以参考chainlit官方提供的样例(
原创
发布博客 2024.07.15 ·
532 阅读 ·
4 点赞 ·
0 评论 ·
5 收藏

React:useState和useEffect

最近因为想要开发一个简单的应用才开始接触React。但是并没有系统学习React,所以这篇博客可能会写的不够专业。
原创
发布博客 2024.07.12 ·
764 阅读 ·
4 点赞 ·
0 评论 ·
3 收藏

Python:正则表达式相关整理

最近因为一些原因频繁使用正则表达式,因为以前系统整理过关于正则表达式的相关知识,所以这里仅记录使用期间遇到的问题。本文内容基于re包。
原创
发布博客 2024.07.12 ·
648 阅读 ·
13 点赞 ·
0 评论 ·
1 收藏

远程过程调用协议gRPC及在go环境下的使用

远程过程调用(Remote Procedure Call,PRC是一种进程间通信技术,它使得程序可以像调用本地函数一样调用远程服务器上的函数。RPC 屏蔽了底层的通信细节,让开发者能够更专注于业务逻辑,而无需关心网络编程的复杂性。
原创
发布博客 2024.06.26 ·
1057 阅读 ·
11 点赞 ·
1 评论 ·
18 收藏

Python并发编程:多线程

全局解释锁(Global Interpreter Lock,简称GIL)是Python(特别是CPython)解释器中的一个机制,这个机制会限制同一时间只有一个线程执行Python字节码。
原创
发布博客 2024.05.25 ·
947 阅读 ·
30 点赞 ·
1 评论 ·
8 收藏

Python并发编程:多进程

并发编程指的是在一个程序中同时执行多个独立的任务(或操作),使得这些任务看起来是同时执行的。并发编程有多种实现方式,这里仅介绍多线程和多进程。模块中,通常使用消息传递机制进行进程之间的通信(尽量避免使用锁这类同步原语)。
原创
发布博客 2024.05.23 ·
623 阅读 ·
4 点赞 ·
0 评论 ·
8 收藏

Python使用asyncio包实现异步编程

在Python中实现异步函数的定义需要两个关键字(async和awaitasyncasync关键字声明一个异步函数。它可以在执行过程中暂停并允许其他代码执行。当你调用一个异步函数时,它会立即返回一个协程对象而不是实际的结果。
原创
发布博客 2024.05.15 ·
1221 阅读 ·
7 点赞 ·
0 评论 ·
11 收藏
加载更多