自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

芒果不茫的博客

nlp打工人

  • 博客(40)
  • 收藏
  • 关注

原创 逐行讲解BiLSTM+CRF实现命名实体识别(NER)

使用BiLSTM+CRF做中文命名实体识别(NER),数据处理、建立词表、模型构建、训练过程书写等,代码有详细注释,若有遗漏或不详细可评论补充。

2023-02-05 21:51:21 8724 52

原创 逐行讲解CRF实现命名实体识别(NER)

使用sklearn_crfsuite的CRF工具做中文命名实体识别(NER), 获取中文原始数据集,处理成sklearn_crfsuite所需要的格式,代码有详细注释,若有遗漏或不详细可评论补充。

2022-10-07 22:31:24 8662 11

原创 如何在windows中使用hfd.sh aria2c下载huggingface文件

介绍如何在windows下使用hfd.sh+aria2c下载huggingface模型文件,并具体介绍hfd.sh的下载及使用方法,windows下aria2c的安装方法。

2024-09-01 01:47:39 1187 1

原创 LLM评估 | 大模型评估方法调研--论文解读(持续更新ing)

调研大模型评估方法,最新论文解读

2024-07-30 13:00:18 681

原创 逐行讲解旋转位置编码RoPE源码(ChatGLM系列)

旋转位置编码详细代码解析,ChatGLM的改动,以及一点思考

2024-05-19 20:38:00 1644

原创 逐行讲解python实现A*路径规划

python实现AStar路径规划算法,代码详细解释,可方便扩展其他功能

2024-04-08 15:16:03 1593

原创 深度学习踩坑记录(持续更新ing)

记录博主调试代码过程中碰到难以解决的bug

2024-03-12 16:17:38 937 1

原创 懒得玩游戏--帮我做数独

最近玩上了一款类似于数独的微信小程序游戏,名字叫数独趣味闯关,过了数独的关卡之后会给拼图,玩了几关之后摸清套路了就有点累了,但是还想集齐拼图,所以就编了个程序自动解数独。

2024-01-14 20:37:34 557

原创 pyqt安装后designer.exe位置

在安装PyQt6或者PyQt5之后需要找到designer.exe位置进行后续操作,但可能由于多方面原因,位置并不固定。本文整理了网络上有关designer.exe位置的信息,读者可以一一尝试,如果在其他位置找到,也可评论区补充。

2024-01-03 01:18:47 1216 1

原创 超详细推导逻辑回归公式与代码实现(二分类与多分类)

本文使用梯度下降法对逻辑回归进行训练,使用类似于神经网络的方法进行前向传播与反向更新,使用数学公式详细推导前向传播与反向求导过程,包括二分类和多分类问题,最后用python代码实现鸢尾花分类(不使用算法库)

2023-07-27 22:03:35 1166

原创 RoPE旋转位置编码图形化理解

很多博文用公式描述RoPE的作用,看来看去还是似懂非懂,本文用图形的方式直观且形象化的展示RoPE的作用

2023-07-15 21:31:35 941

原创 TFIDF代码实现与sklearn库代码分析

介绍了tfidf的理论与细节,对于sklearn库中的方法进行常用参数详解,并将手动计算结果与之对比,最后复现了tfidf。

2023-07-01 20:29:36 357 1

原创 NER实体级别与token级别指标代码实现——precision(精确率)、recall(召回率)、F1分数

本文详细介绍token级别与实体级别指标的不同,并给出各自的代码实现,附有详细注释,打印关键信息,显示可视化结果。

2023-06-07 16:49:55 1190 3

原创 【论文精读】 专注于文档信息抽取的Layout 系列模型

详细讲述Layout系列模型,包括LayoutLM、LayoutLMv2、LayoutXLM、LayoutLMv3,深挖技术细节,模型各部分组成与训练方法。

2023-02-27 00:07:31 974

原创 pip镜像源(临时使用+全局配置)

pip豆瓣源、清华源、阿里源、中科大源地址,临时配置和全局配置教程

2023-02-09 23:05:48 534 1

原创 报错记录:TypeError: classification_report() takes 2 positional arguments but 3 were given

在使用sklearn_crfsuite.metrics.flat_classification_report函数的时候突然报错:TypeError: classification_report() takes 2 positional arguments but 3 were given,这里对该函数进行了详细剖析,找到报错原因,并给出解决办法

2023-01-14 22:27:49 1304 4

原创 逐行讲解HMM实现命名实体识别(NER)

使用HMM做中文命名实体识别(NER), 获取中文原始数据集,对其进行训练、验证、预测,代码有详细注释,若有遗漏或不详细可评论补充。

2022-11-02 21:05:44 3001

原创 手推多分类precision(精确率)、recall(召回率)、F1分数

按照样例手推precision、recall、F1分数,以及多分类时macro、micro、weighted的计算方法,并给出代码实现验证

2022-10-07 20:45:44 6075

原创 超详细推导样本方差和总体方差(n-1的由来)

样本方差为什么除以n-1,本文进行详细数学推导,并介绍自由度的个人理解

2022-09-22 15:39:07 5483

原创 Linux 文本编辑器Vim

Linux Vim文本编辑器的使用命令与操作方式

2022-09-17 14:22:20 184

原创 Linux常用命令

linux常用命令详细介绍

2022-09-13 14:40:40 398

原创 L1L2正则化图形解读

在学习L1、L2正则化的过程中一定看过下面这两幅经典图,看过之后确实懂了L1和L2正则化的区别,无非是一个相交在坐标轴,一个不在坐标轴。但这一圈圈等高线怎么来的,L1正则化一定相交在坐标轴吗?为什么会相交在坐标轴呢?本篇文章从头开始画出这幅图,并介绍其由来。

2022-09-10 17:06:56 612

原创 手推BN、IN、LN、GN

通过实例说明BN、IN、LN、GN如何取均值和方差来进行标准化的,附代码实践证明,手推与pytorch工具箱进行对比

2022-09-01 13:18:50 565 1

原创 Java全栈大数据学习笔记NO.14(MySQL-1)

MySQL介绍mysql里面可以创建很多的数据库,例如,创建一个企业OA系统的数据库数据库里可以有很多张table,数据是存储在table里,如:部门编号部门名称部门地址备注1开发部大连高新园区2人事部大连高新园区表里的列也叫做字段,一行数据也叫做一条记录创建一个员工表(Employee)编号 Empno姓名 Ename性别 sex职务 Job工资 Salary所在部门编号 Deptno1开发部大连高新园区

2021-06-30 12:34:44 341

原创 Java全栈大数据学习笔记NO.15(JAVASE-2)

JAVASE-2一、继承1.1 为什么用继承1.2 继承的语法1.3 继承的特点1.4 super和this1.5 子父类的构造方法执行顺序问题1.6 方法的重写、覆盖,子类的方法覆盖父类继承过来的方法1.7 父类里的哪些成员可以被子类继承1.8 抽象类和抽象方法二、多态三、接口3.1 什么是接口3.2 接口的语法一、继承1.1 为什么用继承  为了实现代码的重用,将多个类里的共同的属性和方法,写在一个类里作为父类,需要写的类作为子类,继承父类里的属性和方法,子类和父类要符合 is-a的关系。1.2

2021-04-06 22:54:38 467

原创 Java全栈大数据学习笔记NO.14(JAVASE-1)

JAVASE-1一、类和对象什么是对象什么是类类和对象的关系是什么java程序中怎么使用对象怎么创建类通过类创建对象,并使用对象对象数组二、方法方法的调用面向对象解决方法的思路局部变量与成员变量的区别三、构造方法特点和执行的时间点无参构造方法和带参构造方法方法重载static的作用封装一、类和对象什么是对象什么是类  类是对象的集合,就是一个概念,通过这个概念,可以知道同一类的对象具有的共同的属性和方法,只是属性值不同而已。  类是抽象的。类和对象的关系是什么  类和对象的关系是抽象和实体(

2021-04-05 23:02:06 474 2

原创 Java全栈大数据学习笔记NO.13(jQuery-2)

jQuery-2一、jq操作css样式二、jq的尺寸三、json遍历四、jq的each循环一、jq操作css样式addClass() 向被选元素添加一个或多个样式removeClass() 从被选元素删除一个或多个样式toggleClass() 对被选元素进行添加/删除样式(类)的切换操作上面几条语句的用法如下,点击不同按钮应用不同功能.important{/* css中写 */ font-weight: bold; font-size: 40px;}.blue{ color: b

2021-02-23 14:59:29 122

原创 Java全栈大数据学习笔记NO.12(jQuery-1)

jQuery一、jQuery二、jq的使用三、jq的基本语法四、jq的选择器五、jq的事件六、jq的效果七、jq的动画八、jq的回调九、jq方法的链接十、jq操作内容和属性一、jQueryjQuery简介jQuery是由美国人John创建于2006年,它是目前最流行的js程序库,它对js的对象和函数进行封装,设计思想是write less,do more。jq能干什么访问和操作DOM对象控制页面样式对页面事件进行处理扩展新的jq插件与Ajax技术完美结合jq的优势体积

2021-02-23 13:29:21 784

原创 Java全栈大数据学习笔记NO.11(JavaScript提升2)

JavaScript提升2一、一、

2021-02-23 00:46:37 236

原创 Linux学习笔记--提升

Linux学习笔记--提升一、远程登录Linux二、XShell5使用一、远程登录Linux  由于我们在实际工作中,手里的电脑和Linux系统所在的电脑常常分处两地,所以需要远程登录到Linux进行操控。这里就需要两个软件:  XShell5:远程登录到Linux的软件;  XFtp5:远程上传和下载文件的软件;如果希望安装好XShell5就可以远程访问Linux的话,需要有一个前提,就是Linux启用了SSHD服务,该服务会监听22号端口,相当于开启了一个耳朵来与外界进行通信。启用方法为在终端

2021-02-16 19:24:24 230

原创 Linux学习笔记--基础

linux学习笔记一、学习初衷二、环境搭建一、学习初衷  本来想学一下Git,但Git需要用到很多linux指令,正好之前做嵌入式开发就想学linux来着,趁此机会学习一下,在此记录学习笔记。  linux 应用的广泛度很高,也很出名,想学的人自然知道linux的好处,在此就不重复那些了,下面直接进入学习。二、环境搭建  由于linux是一个操作系统,而我们用的windows也是操作系统,所以需要安装一个虚拟机,然后在虚拟机上安装一个linux系统来学习。  在此之前首先说一下linux的发行版

2021-02-13 17:12:52 185

原创 Java全栈大数据学习笔记NO.10(JavaScript提升1)

JavaScript提升一、数组二、数组常用的方法三、类和对象四、String常用方法和属性一、数组由于 JavaScript 是弱类型语言,所以在数组的赋值中不做类型区分,各种类型的变量都可以放到同一个数组中,定义方法有以下几种,并且可以用 .length 来获取数组长度:var arr1 = [99,98,"hello","world",true];var arr2 = new Array(11,22,"张三",false,0,33);var arr3 = new Array(10); //创

2021-02-06 22:39:34 223

原创 Java全栈大数据学习笔记NO.9(JavaScript基础)

一、JavaScript简介JavaScript是一种直译式脚本语言,是一种动态类型、弱类型、基于原型的语言,内置支持类型。它的解释器被称为JavaScript引擎,为浏览器的一部分,广泛用于客户端的脚本语言,用来给HTML网页增加动态功能。二、JavaScript特点脚本语言:是一种解释型的脚本语言,C、C++等语言都是先编译后执行,而JavaScript是在程序的运行过程中逐行进行解释。基于对象:是一种基于对象的脚本语言,它不仅可以创建对象,也能使用现有的对象。简单:采用的是弱类型的变量类型

2021-02-02 00:19:50 241

原创 Java全栈大数据学习笔记NO.7(CSS基础)

CSS基础一、CSS简介二、使用CSS的原因三、CSS优点四、CSS位置五、CSS种类六、CSS注释七、样式表优先级八、CSS语句结构九、选择器的种类一、CSS简介CSS(Cascading Style Sheets):级联样式表,多个样式组合在一起对控件进行布局和外观的修饰的表。二、使用CSS的原因html控件太丑了html规定规范的时候没有充分考虑到用户自定义控件外观。三、CSS优点能够非常灵活的自定义控件的显示效果。在外部编写,在多个页面引用相同的css,方便用以管理控件的样式。

2021-01-25 19:53:33 293 1

原创 Java全栈大数据学习笔记NO.6(HTML提升2)

HTML提升2一、表单二、实体字符三、视频标签一、表单新建目录与html文件  form标签,在网页中是看不见的元素,一个表单可以包含多个控件,作用是提交表单中的数据到指定位置。属性:  action:用于处理数据的程序路径,当提交表单时就会执行此程序。  method:get和 post 提交数据的方式,  1. get 表示提交的数据会在网页url后面发送到服务器,get比较适合数据量小的情况(默认),跳转后,会在网页url后多一个?用于连接url和传输的数据,数据和数据之间用&连

2021-01-24 23:29:12 161

原创 Java全栈大数据学习笔记NO.5(HTML提升1)

HTML提升1一、无序列表二、有序列表三、图片标签img路径四、超链接标签五、水平线六、表格七、图层八、行内布局一、无序列表可以用来制作一个项目符号的效果<ul> <li>C语言</li> <li>C++</li></ul>可以在ul标签中通过设置type属性来设置符号的种类,符号种类有:disc(黑点)(默认)circle(圆圈)square(方块)none(无符号)如书写:<ul type="

2021-01-24 22:43:57 260

原创 Java全栈大数据学习笔记NO.4(初学HTML)

初学HTML代码解释代码解释<!DOCTYPE html>声明文档类型,声明的是 html 的版本,!DOCTYPE html 是最新的 HTML5,版本还有 HTML1.0 2.0 3.0 4.0 4.01。它要放在整个文件的第一行,并且这个声明不是标签,是告诉 web 浏览器这个代码要使用哪个版本的HTML进行编写。<meta charset="utf-8">meta 标签是元数据标签,作用是告诉浏览器和搜素引擎关于我们网页的一些基本信息,他属于“自我了断型”标签,

2021-01-24 21:08:28 514 2

原创 Java全栈大数据学习笔记NO.3(Java语言提升)

Java语言提升一、循环与判断二、Java中的方法三、数组定义数组默认值一、循环与判断  Java中的if、if-else、switch判断,for、while、do-while循环以及break、continue的用法都与C语言相同,这里不再记录。二、Java中的方法  Java中的方法就相当于C语言中的函数,通过自己编写想要重复实现的功能并打包成方法(函数),在其他程序中重复调用。  Java方法的定义与C语言略微不同,它需要在类的内部定义,并与main函数并列,如:public class

2021-01-15 22:00:47 75

原创 Java全栈大数据学习笔记NO.2(Java语言基础)

Java语言基础一、内存二、打印输出语句区别三、强类型语言四、基本数据类型(四类八种)特殊情况五、ASCII编码与Unicode编码六、转义字符七、String字符串类型八、自动类型提升九、控制台输入十、其他一、内存内存是一块瞬时状态的存储空间,有一定的存量。Java虚拟机(Java程序)默认分配的物理内存容量是计算机的1/8。二、打印输出语句区别System.out.print();System.out.println();public class Test{ public static

2021-01-13 22:33:57 130 1

原创 Java全栈大数据学习笔记NO.1(Java入门)

Java全栈大数据学习笔记Java全栈大数据学习笔记名词解释环境搭建第一个程序标识符约定俗称BUGJava全栈大数据学习笔记 由于之前学习过C语言和Python,在此基础上想自学一下Java,相当于小白,在此记录学习笔记。名词解释Java SE(Stadard Edition):标准版;Java EE(Enterprise Edition):企业版。Java ME(Micro Edition):微型版。JVM(Java Virtual Machine)虚拟机:使用软件在不同的操作系统中,模

2021-01-11 18:40:30 381 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除