自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

颹蕭蕭

苟有恒,何必三更眠、五更起。 最无益,莫过一日曝、十日寒。

  • 博客(808)
  • 资源 (36)
  • 收藏
  • 关注

原创 python logging 避免日志重复打印

【代码】python logging 避免日志重复打印。

2024-07-18 11:00:29 181

原创 多核并行加速 tokenizer

tqdm 监控任务进度。

2024-07-16 14:00:23 167

原创 docker 本地部署大模型(ollama)

此处由于挂载目录使用了相对路径,所以本地文件夹位于 /var/lib/docker/volumes/ollama而非运行命令的相对路径测试 api。

2024-07-08 12:23:33 435

原创 python singledispatch 根据传入参数的类型自动选择相应的实现

装饰器提供了一种在 Python 中实现函数重载的方式。虽然 Python 本身不支持传统的函数重载(即在同一个作用域中定义多个同名函数),但。在上述示例中,process 函数根据传入参数的类型(int、str、list)选择不同的处理逻辑,这就是一种函数重载的形式。装饰器允许你定义一个函数,并根据传入参数的类型自动选择相应的实现。这在处理不同类型的输入时非常有用。允许你根据参数类型来选择不同的函数实现,从而实现类似重载的效果。下面是一个简单的示例,展示了如何使用。

2024-07-08 10:08:56 215

原创 数据识别概述

数据识别分为直接识别和间接识别

2024-07-04 16:01:20 91

原创 python 判断 〇 是否在\u4e00-\u9fff范围内

在Unicode编码中,\u4e00-\u9fff范围代表了中日韩统一表意文字(CJK Unified Ideographs),这个范围包含了大部分的汉字。要判断一个字符是否在这个范围内,可以使用编程语言中的字符编码函数。函数获取该字符的Unicode编码,然后检查这个编码是否在\u4e00-\u9fff范围内。,并不在\u4e00-\u9fff范围内。以下是一个使用Python语言的示例代码,用于判断字符。实际上是一个中日韩兼容表意文字,其Unicode编码是。如果你需要判断的是其他字符,只需将。

2024-06-03 14:44:36 415 1

转载 BERT+CRF 设置不同的学习率

参考文献https://blog.csdn.net/qq_41554005/article/details/119898464https://kexue.fm/archives/7196https://arxiv.org/pdf/2301.02459https://blog.csdn.net/weixin_40959890/article/details/128973262

2024-05-30 16:59:51 61

原创 BERT ner 微调参数的选择

针对批大小和学习率01。

2024-05-21 14:24:02 439

原创 ner pipeline 超长文本处理

在使用transformer模型做NER识别时,通常会用上pipeline因此非常有必要对超长文本分批处理,每次处理部分,最后合并结果。

2024-05-20 20:44:21 229 1

原创 NER 数据集格式转换

某些地方的数据和标签拆成两个文件了tags.txt。

2024-05-20 19:49:16 222

原创 NER 评价指标计算

【代码】NER 评价指标计算。

2024-05-14 19:00:39 196

原创 spacy NER 位置信息不考虑空格!!!

令人震惊和愤怒的是三次结果输出的位置是一样的!spacy居然先把空格过滤了再输出位置。虽然输出的实体位置不是真实的位置,但displacy渲染结果都是对的。

2024-05-14 18:37:06 153

原创 基于模板生成 NER 训练数据

模板中的标记作为占位符,用实际的数据去填充。

2024-05-14 10:12:27 370

原创 spacy微调BERT-NER模型

spacy 微调 bert ner 模型,使用 gpu

2024-05-13 21:44:16 381

原创 手把手教你用 spacy3 训练中文NER

手把手教你用自己的语料训练spacy的NER模型

2024-05-12 12:08:51 523 2

原创 spacy.prefer_gpu 失败

参考:https://github.com/explosion/spaCy/discussions/10441。参考:https://spacy.io/usage。检查正确的spacy cuda版本。检查一下脚本是否正常执行。

2024-05-11 15:34:33 159

原创 CRF++ 中文NER

如何使用CRF++工具来训练一个中文命名实体识别(NER)模型

2024-05-11 11:21:16 396

原创 使用规则进行命名实体识别(NER)

基于规则的NER方法是一种古老但依然有其价值的方法。它在特定场景下,如领域文本处理、实时应用等,具有不可替代的优势。然而,随着深度学习技术的发展,基于规则的NER方法正逐渐被基于模型的方法所取代。未来,如何将规则的方法与模型的方法相结合,发挥各自的优势,是一个值得探索的方向。

2024-05-10 11:10:47 1098

原创 bert-NER 转化成 onnx 模型

BERT-NER 转化成 onnx 模型

2024-05-09 20:52:06 381

原创 spacy displacy 展示 NER 结果

ner 可视化

2024-05-09 14:35:46 163

原创 BGE 模型转 onnx

bert 模型 转 onnx

2024-04-23 16:21:51 589

原创 BERT-CRF 微调中文 NER 模型

pytorch BERT CRF NER

2024-04-23 15:41:15 867

原创 BERT tokenizer 增加全角标点符号

bert 的词表,哪怕是 bert-base-chinese,对中文全角标点的支持不是很好。文件里把这些标点加上。直接替换 [unused] token 即可。因此在微调bert时,需要在。

2024-04-22 19:03:57 354

原创 BERT 微调中文 NER 模型

BERT 微调 NER 模型

2024-04-16 21:26:29 550

原创 NER 原始数据处理

【代码】NER 原始数据处理。

2024-04-13 15:55:11 245

原创 pytorch 查看 GPU 型号

【代码】pytorch 查看 GPU 信号。

2024-04-12 13:50:29 328

原创 Error: pg_config executable not found.

Error: pg_config executable not found.

2024-04-11 23:31:33 302

原创 使用 bert-base-chinese-ner 模型实现中文NER

bert 中文 ner

2024-04-11 19:58:54 976

原创 python + jdbc 连接 达梦数据库

python 达梦数据库

2024-04-10 20:08:07 347 1

原创 Streamlit + langchain 实现RAG问答机器人

【代码】Streamlit + langchain 实现问答机器人。

2024-04-08 20:20:35 590

转载 央国企名单

央国企名单

2024-03-28 13:04:42 261

原创 AzureOpenAI 流式返回结果

openai chat_completion 接口流式返回

2024-03-27 20:11:21 347

原创 WPS 按数值大小显示渐变颜色

WPS EXCEL 中按数值大小设置渐变颜色

2024-03-22 00:11:05 315 1

原创 python 爬取杭州小区挂牌均价

【代码】python 爬取杭州小区挂牌均价。

2024-03-21 19:01:29 574 4

原创 手把手带你实现大模型检索增强生成RAG(一)——数据清洗准备

首先,需要整理一大堆可以用来检索的文本数据,这些数据可以是网页、论文、报告、电影脚本、电视剧脚本等等。这些数据可以是原始的文本数据,也可以是经过清洗、处理过的文本数据。由于秘籍是pdf的,所以先要从pdf转成txt文件。当然,这个代码直接交给gpt去完成了。当然,二道贩子难免会在pdf里夹带私货,所以还需要对提取后的文本进行清洗、处理。经过以上步骤,我们就得到了一份清洗、处理后的文本数据,可以用来检索。清洗后的文件已上传csdn,放在评论区,欢迎大家下载。作为IT打工仔,我从二道贩子处购入一本软考秘籍。

2024-03-14 14:04:40 703 1

原创 python钉钉机器人加签

description:机器人发送签名不匹配;solution:请确认签名和生成签名的时间戳必须都放在调用的网址中,请确认机器人的密钥加密和填写正确;

2024-03-04 14:13:56 543

原创 python 自定义表达式解释器

【代码】python 自定义表达式解释器。

2024-02-26 20:32:47 407 2

转载 ubuntu下docker ps没有容器,但是实际容器进程还在运行

同时安装了apt和snap版本的docker。

2024-02-18 16:39:14 157

原创 解析qlib表达式引擎

【代码】解析qlib表达式引擎。

2024-02-05 14:27:47 519

原创 contextlib 自定义上下文管理

try:yieldfinally:print('[耗时]: {}s'.format(time.time() - tic))

2024-02-04 14:46:58 382

BERT-CRF 中文 ner 模型微调

BERT-CRF 中文 ner 模型微调

2024-05-09

2024年3月杭州及周边小区挂牌价格

杭州及周边小区挂牌价格 小区数量:4000+ 时间节点:2024年3月 可用于:数据分析、可视化实验 可用于:地理位置数据收集 可用于:固定资产投资参考,买房有风险,投资需谨慎!

2024-03-22

用于大模型RAG的检索语料

用于大模型RAG的检索语料

2024-03-14

Win10 左手用户的鼠标指针

Win10 左手用户的鼠标指针

2022-06-15

网络安全数据挖掘 CS259D课件

网络安全数据挖掘 CS259D课件 Data Mining for CyberSecurity

2021-09-08

利用 SIFT 实现图像拼接 python 代码

利用 SIFT 实现图像拼接:https://goodgoodstudy.blog.csdn.net/article/details/89157849

2021-01-01

python 使用摄像头监测心率

参见博文:https://blog.csdn.net/itnerd/article/details/109078291 使用 opencv 检测人体皮肤颜色变化,计算心率

2020-10-14

中图分类号.xlsx

史上最全中图分类号,史上最全中图分类号,史上最全中图分类号 45835条,45835条,45835条, 官网抓取,如假包换

2020-09-11

知网爬虫.ipynb

python 爪巴虫爪巴知网。 selenium 通过模拟鼠标点击,自动实现:选择检索词的类别、输入检索词、选择精确还是模糊查找、逻辑关系、点击检索按钮等一系列动作

2020-09-10

Python 图片中扭曲矩形的复原

博文地址:https://blog.csdn.net/itnerd/article/details/108429553 Python 实现图片中扭曲矩形的复原

2020-09-06

icml2020文章列表及下载链接.zip

icml 2020 所有文章的下载链接,全部 1086 篇文章,链接点击直接跳转到 pdf,可直接下载paper

2020-08-31

icml2020.xlsx

excel 文件,icml 2020 所有文章的下载链接,全部 1086 篇文章,链接点击直接跳转到 pdf

2020-08-31

explore_data.ipynb

时间序列论文常用数据集,下载及可视化, python https://goodgoodstudy.blog.csdn.net/article/details/106244526

2020-05-20

数据透视表分析数据.xlsx

用于练习 EXCEL 数据透视表,零售平台订单数据。用于练习 EXCEL 数据透视表,零售平台订单数据。

2020-05-16

Introduction to symmetry analysis (2002) [Brian J. Cantwell]

Introduction to symmetry analysis (2002) [Brian J. Cantwell] 对称性分析

2020-01-07

微信自动回复天气程序

https://blog.csdn.net/itnerd/article/details/103433296

2019-12-07

Feedback Control in Systems Biology

反馈控制 系统生物学 Feedback Control in Systems Biology Carlo Cosentino and Declan Bates

2019-09-18

headct_3d.ipynb

dicom 格式, mhd 格式 , 头部 CT 切片, 3D 重建 , python

2019-07-25

lung_segmentation.ipynb

肺部CT图像分割 (.raw .mhd 格式图像数据) , python 程序, 肺部 3D 可视化

2019-07-03

ICML 2019年 会议文章目录 (含论文下载链接)

international conference on machine learning(ICML) 2019年 会议文章目录 含论文下载链接

2019-06-04

《应用非线性控制》【Slotine & Weiping Li 著】MIT经典教材

《应用非线性控制》中文版【Slotine & Weiping Li 著】MIT经典教材 原名《Applied Nolinear Control》

2019-01-05

网络优化:连续和离散模型(英文文字版)【Dimitri P. Bertsekas】

网络优化:连续和离散模型 英文文字版 Dimitri P. Bertsekas

2018-10-12

系统与控制理论中的线性代数 【黄琳】

系统与控制理论中的线性代数 【黄琳】

2018-10-11

凸优化习题答案【Boyd】

凸优化习题答案【Boyd】

2018-10-07

线性代数与解析几何(郑广平)复旦大学出版社

线性代数与解析几何

2018-09-27

遗传算法java小程序(吃豆人)

遗传算法 java 小程序,可以看成吃豆人的简化版! Model类和Display类里的main函数都可以运行! 谢谢支持!

2018-09-27

Handbook of Matrices

handbook of matrices handbook of matrices handbook of matrices handbook of matrices

2018-09-22

All of Statistics

all of statistics

2018-09-20

算法设计(英文文字版)by Jon_Kleinberg & Eva_Tardos

英文版 算法设计 Preface Algorithmic ideas are pervasive, and their reach is apparent in examples both within computer science and beyond. Some of the major shifts in Internet routing standards can be viewed as debates over the deficiencies of one shortest-path algorithm and the relative advantages of another. The basic notions used by biologists to express similarities among genes and genomes have algorithmic definitions. The concerns voiced by economists over the feasibility of combinatorial auctions in practice are rooted partly in the fact that these auctions contain computationally intractable search problems as special cases. And algorithmic notions aren’t just restricted to well-known and longstanding problems; one sees the reflections of these ideas on a regular basis, in novel issues arising across a wide range of areas. The scientist from Yahoo! who told us over lunch one day about their system for serving ads to users was describing a set of issues that, deep down, could be modeled as a network flow problem. So was the former student, now a management consultant working on staffing protocols for large hospitals, whom we happened to meet on a trip to New York City. The point is not simply that algorithms have many applications. The deeper issue is that the subject of algorithms is a powerful lens through which to view the field of computer science in general. Algorithmic problems form the heart of computer science, but they rarely arrive as cleanly packaged, mathematically precise questions. Rather, they tend to come bundled together with lots of messy, application-specific detail, some of it essential, some of it extraneous. As a result, the algorithmic enterprise consists of two fundamental components: the task of getting to the mathematically clean core of a problem, and then the task of identifying the appropriate algorithm design techniques, based on the structure of the problem. These two components interact: the more comfortable one is with the full array of possible design techniques, the more one starts to recognize the clean formulations that lie within messy problems out in the world. At their most effective, then, algorithmic ideas do not just provide solutions to well-posed problems; they form the language that lets you cleanly express the underlying questions. The goal of our book is to convey this approach to algorithms, as a design process that begins with problems arising across the full range of computing applications, builds on an understanding of algorithm design techniques, and results in the development of efficient solutions to these problems. We seek to explore the role of algorithmic ideas in computer science generally, and relate these ideas to the range of precisely formulated problems for which we can design and analyze algorithms. In other words, what are the underlying issues that motivate these problems, and how did we choose these particular ways of formulating them? How did we recognize which design principles were appropriate in different situations? In keeping with this, our goal is to offer advice on how to identify clean algorithmic problem formulations in complex issues from different areas of computing and, from this, how to design efficient algorithms for the resulting problems. Sophisticated algorithms are often best understood by reconstructing the sequence of ideas—including false starts and dead ends—that led from simpler initial approaches to the eventual solution. The result is a style of exposition that does not take the most direct route from problem statement to algorithm, but we feel it better reflects the way that we and our colleagues genuinely think about these questions.

2018-09-19

icml 2016年 会议文章目录

international conference on machine learning(ICML) 会议文章目录,含论文下载链接

2018-09-17

icml 2017年 会议文章目录

international conference on machine learning (ICML)2017年会议文章目录,含论文下载链接

2018-09-17

icml 2018年 会议文章目录(含文章下载链接)

international conference on machine learning (ICML) 2018年会议文章目录, 含论文下载链接

2018-09-17

the art of human hacking

在强大的系统也离不开管理维护他们的人员,人往往是该系统最脆弱的一环

2018-05-26

link prediction in social networks: law of power distribution

link prediction in social networks: law of power distribution

2018-01-23

《Combinatorial Optimization》Cook, Cunningham, Pulleyblank, Schrijver

《Combinatorial Optimization》Cook, Cunningham, Pulleyblank, Schrijver

2017-11-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除