自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 问答 (1)
  • 收藏
  • 关注

原创 mysql根据多个字段去重

现在在搞数据处理,里面有个数据是根据两个字段来区别是不是一样的,那如果在设计的时候没有将那两个字段设计成唯一主键,或者唯一索引,后续就要进行去重,上网查了好久,发现都没有啥好的解决方法,后来想了下,将那两个主键连接一下,然后group分组不就行了?虽然性能很弱鸡,但是这个sql我又只是用一次而已。SELECT 字段1 , 字段2, 字段3, 字段4, concat(字段1,字段2)FROM 表名GROUP BY concat(字段1,字段2) ;这样就行了,

2021-03-03 17:09:25 3408 4

原创 新版Jupyter Lab配置方法,修改默认工作目录,生成配置文件

新版Jupyter Lab配置方法,修改默认工作目录,生成配置文件今天在windows搞jupyter lab的配置,死活改不了工作目录,上网看的方法都是像下面这样但是就算修改了,也生效不了。。。。。后来发现,是这个生成配置文件的命令有问题,不应该是jupyter notebook --generate-config而是:jupyter lab --generate-config这样生成的配置文件就是正确的记录一下,希望遇到同样问题的人可以看看...

2021-03-01 17:32:22 2479 2

翻译 使用google的bert结合哈工大预训练模型进行中文/英文文本二分类,基于pytorch和transformer

使用bert的哈工大预训练模型进行中文/英文文本二分类,基于pytorch和transformer前提简要介绍开始导入必要的包和环境准备并读取数据导入模型的tokenizer对数据进行tokenizer,也就是分片,并加入`[CLS]`、`[SEP]`等bert的默认标签对句子进行attention_mask:分割训练数据集和验证数据集,在这将90%的进行训练,10%进行验证转换为torch tensor:使用pytorch的dataloader帮助我们进行batch_size的划分和自动化输入模型导入查看

2020-11-27 00:57:30 8612 15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除