未来科技工作室-CSDN博客

原创 Prompt的科学范式（上篇）

相信很多人在用LLM做下游任务时，能够感受到prompt不同写法的重要性。同样的一段文本，不同的 prompt写法可能会得到完全不同的结果。因此，了解和掌握prompt写法是非常必要的。

2023-09-27 10:18:43 778

原创 bert-ini:一种基于bert的实体对齐交互模型

本次分享一项来自IJCAI-20的实体对齐工作，该工作提出了一种不同于以往的采用图结构信息进行实体对齐的技术方案，该方案取得了当时的最好效果；不仅如此，模型本身的对齐效率在该项工作中也被考虑，实际工作中非常具备借鉴意义。

2022-04-04 22:19:02 2613 1

原创关系抽取实验记录

1 数据集统计信息训练集：最大句子长度： 1020 ;最小句子长度： 0 ;平均句子长度： 57.87416666666667 book music video 最大句子长度最小句子长度平均句子长度分布图 train_10 7 10 8 160 58 89.8 验证集：最大句子长度： 658 ;最小句子长度： 1 ;平均句子长度： 52.403666666666666 ...

2020-12-16 19:54:13 277

转载打造 Windows 10 下最强终端方案：WSL + Terminus + Oh My Zsh + The Fuck

前言经历了数天的磨难，终于把 OpenWrt 编译成功了，为了表达成功的喜悦放了张图，没想到引起了小伙伴们的骚动。于是我决定写一篇关于我现在在 Windows 10 下使用的终端方案的配置教程。WSL适用于 Linux 的 Windows 子系统（英语：Windows Subsystem for Linux，简称 WSL）是一个为在 Windows 10 和 Windows Server 2019 上能够原生运行 Linux 二进制可执行文件（ELF 格式）的兼容层。.

2020-12-12 19:00:46 5319 1

原创实体识别（基于pytorch深度学习框架实现）

1 说明本项目基于pytorch深度学习框架实现各NLP任务，不断完善中，项目代码：https://github.com/GuocaiL/Craig-Ai.2 目录├── data 存放项目数据的目录│ ├── ResumeNER 简历实体识别数据│ │ ├── dev_1000_filter.txt 1000验证集│ │ ├── train_20_filter.txt 20训练集│ └── yidu-s4k 依渡云实体识别数据│ ├── dev_100.

2020-12-06 12:13:24 1191 1

原创 Markdown常用书写格式

参考:https://www.jianshu.com/p/9ab92efc286a

2020-12-06 11:05:35 236

原创实体识别实验记录

一、数据预处理二、初赛训练：CUDA_VISIBLE_DEVICES=0nohuppythontrain_model.py-tr../competition_data/tianchi_yiyao/train.txt-ttner-ebert-sml512-sp../competition_data/tianchi_yiyao-mnv1-lr1e-5-scTrue-me200-pg1>>../competition_data/tianchi_...

2020-11-19 18:40:29 225

原创解决梯度裁剪和梯度爆炸的方法及原理

1 梯度爆炸和梯度消失产生的原因前向传播产生loss:y为真实标签反向传播：以上述简单网络中为例，梯度爆炸的现象为靠近输入层的权重更新幅度较大，产生的原因为后面层的权重初始化时初始值过大，由于连乘机制导致从后向前传播计算的梯度过大，如上述网络梯度过大是由于初始值过大导致。梯度消失的现象为靠近输入层的权重更新幅度过小，产生的原因为激活函数选取不当，选取的激活函数梯度值过小，由于连乘机制导致从后向前传播计算得到的梯度过小，如上述网络梯度过小是由于过小导致。总之，梯度消失和

2020-11-19 00:53:29 608

原创混淆矩阵、召回率、精确率、准确率、宏平均F1和微平均F1

1 混淆矩阵预测为真预测为假类别为真正确预测成真（True Positive，TP）错误预测为假（False Nagetive，FN）类别为假错误预测为真（False Positive，FP）正确预测为假（True　Nagetive，TN）２准确率、精确率、召回率、F1 score准确率:模型预测正确的个数所占总样本的比例精确率:模型预测为真的样本中,真正的正样本所占的比例召回率:样本中预测的类别和应该预测成该类别所.

2020-11-15 12:56:25 1895

原创字节自然语言处理算法校招面经整理（二）

面经来源：https://zhuanlan.zhihu.com/p/87147047一面请移步：https://blog.csdn.net/qq_33331424/article/details/109397587介绍一下CRF 介绍交叉熵loss公式说一下BERT与ELMO的区别 pytorch的代码流程（我是这样回答的：预处理数据/词表-写好模型-定义损失和优化器-训练-测试） Dropout的原理 sgd与adam的区别 L1 L2正则化编程题：最快速度最小空间求一个数组..

2020-11-11 16:40:48 485

原创字节自然语言处理算法校招面经整理（一）

面经来源：https://zhuanlan.zhihu.com/p/87147047一面双向 BERT 与BiLSTM 有什么不同？BERT的transform结构来源于下面的公式： ...

2020-10-31 11:08:35 749

原创各个开放实体识别数据集信息统计

1、CLUENER2020：https://link.zhihu.com/?target=https%3A//arxiv.org/abs/2001.04351数据说明实体类型说明地址（address） **省**市**区**街**号，**路，**街道，**村等（如单独出现也标记）。地址是标记尽量完全的, 标记到最细。书名（book）小说，杂志，习题集，教科书，教辅，地图册，食谱，书店里能买到的一类书籍，包含电子书。公司（company） **公司，**集团

2020-10-21 12:15:11 3570

原创 win10+anaconda3+python3.6+tensorflow1.11(gpu)+bert从零搭建指南

一、安装anconda3+python3.6+tensorflow1.111、下载：https://repo.anaconda.com/archive/Anaconda3-2019.03-Windows-x86_64.exe2、下载完成后双击安装，有个添加环境变量的选项勾选，选择安装默认版本的python不勾选3、运行以下命令运行：python当前版本为python3.7版本运行：conda create --name tensorflowgpu python=3.6运.

2020-10-20 11:31:53 468

原创 colab使用笔记

使用nvidia-smi命令查看GPU不断更新，如需转载请标注来源python3环境下：!ln -sf /opt/bin/nvidia-smi /usr/bin/nvidia-smiimport subprocessprint(subprocess.getoutput('nvidia-smi'))python2环境下：!ln -sf /opt/bin/nvidia-smi /usr/bin/nvidia-smiimport commandsprint(commands.getoutput

2020-10-14 19:13:14 388

转载从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史

Bert最近很火，应该是最近最火爆的AI进展，网上的评价很高，那么Bert值得这么高的评价吗？我个人判断是值得。那为什么会有这么高的评价呢？是因为它有重大的理论或者模型创新吗？其实并没有，从模型创新角度看一般，创新不算大。但是架不住效果太好了，基本刷新了很多NLP的任务的最好性能，有些任务还被刷爆了，这个才是关键。另外一点是Bert具备广泛的通用性，就是说绝大部分NLP任务都可以采用类似的两阶段模式直接去提升效果，这个第二关键。客观的说，把Bert当做最近两年NLP重大进展的集大成者更符合事实。本文的主

2020-07-06 23:56:04 247

qq_33331424的博客

原创 Prompt的科学范式（上篇）

原创 bert-ini:一种基于bert的实体对齐交互模型

原创关系抽取实验记录

转载打造 Windows 10 下最强终端方案：WSL + Terminus + Oh My Zsh + The Fuck

原创实体识别（基于pytorch深度学习框架实现）

原创 Markdown常用书写格式

原创实体识别实验记录

原创解决梯度裁剪和梯度爆炸的方法及原理

原创混淆矩阵、召回率、精确率、准确率、宏平均F1和微平均F1

原创字节自然语言处理算法校招面经整理（二）

原创字节自然语言处理算法校招面经整理（一）

原创各个开放实体识别数据集信息统计

原创 win10+anaconda3+python3.6+tensorflow1.11(gpu)+bert从零搭建指南

原创 colab使用笔记

转载从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史

原创 linux(centos)中文乱码解决方案

原创论文解读：半监督双向语言模型的序列标记

原创解读：Few-shot classification in Named Entity Recognition Task

原创 anaconda离线安装gensim

原创 Activity的生命周期

原创 Android天气项目更新按钮实现旋转

原创 RDF 1.1 N-Triples

空空如也

空空如也