自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 spyder4使用和调试教程

首先,spyder4.x比较spyder3.x强大很多了,ui等各方面也很多。这篇文章以我平时最常用的spyder4.1.2、4.1.5为例,分享一些使用spyder4.0使用和调试过程中的一些心得。本文分为两个部分:第一部分,介绍spyder4的强大功能。第二部分,介绍spyder4的调试功能。熟悉使用spyder写代码和运行程序的朋友可以直接跳过第一部分,直接看第二部分。第一部分,spyder4的强大功能工欲善其事必先利其器。这也是为什么非要用spyder而不用pycharm的原因,但pych

2021-02-08 23:42:50 5978 2

原创 LLama-Factory使用教程

注意,本地数据只能改成LLama-Factory接受的形式,即本地数据只能支持”promtp/input/output“这种对话的格式,不支持传统的文本分类/实体抽取/关系抽取等等schema数据,如果需要,请想办法改成对话形式的数据。和其他可选的改动信息,例如save_steps,per_device_train_batch_size等等。​ 你需要参考其中的一个文件和它的配置,例如:alpaca_gpt4_data_zh.json,训练和验证数据同样改成这种格式,并在。​ 基本流程/原理:将。

2024-06-28 17:43:11 792 1

原创 LLaMa、Qwen、ChatGLM、ChatGLM2的区别

原始bert,LayerNorm + multiHeadAttention + dropout + FFN + dropout + x+ FFN:其中x来自第一次FFN之后hidden_states = self.dropout_add(feedforward_output, residual) # x在这。

2023-12-23 14:16:02 3699

原创 Transformers文本分类微调和TensorRT推理加速

Transformers文本分类微调和TensorRT推理加速

2022-11-23 21:57:27 775 1

原创 今日笔记---hive+spark

一,hive查询表字段类型二,pyspark中size=lambda x: len(x)三,udf函数中最好写明type四,pyspark dataframe.where中可以使用多个逻辑判断五,Linux统计当前文件夹下的文件个数、目录个数: 1.文件个数:ls -l |grep "^-"|wc -l 2.当前层的文件夹个数:ls -l |grep "^d"|wc -l 3.所有层的文件个数:ls -lR|grep "^-"|wc -l 4.所有曾的...

2021-10-29 10:45:30 450

原创 Pandas比较两个DataFrame是否相同

df1.equals(df2)True则相同False则不同不使用其他任何模块,极为简单!~

2021-07-29 18:33:09 1995

原创 Python yield方法原理

Python yield方法原理您可能听说过,带有 yield 的函数在 Python 中被称之为 generator(生成器),何谓 generator ?我们先抛开 generator,以一个常见的编程题目来展示 yield 的概念。如何生成斐波那契數列斐波那契(Fibonacci)數列是一个非常简单的递归数列,除第一个和第二个数外,任意一个数都可由前两个数相加得到。用计算机程序输出斐波那契數列的前 N 个数是一个非常简单的问题,许多初学者都可以轻易写出如下函数:清单 1. 简单输出斐波那契數

2021-02-27 19:40:15 257

原创 Ubuntu16.04中neo4j安装与使用

使用Debian repositorywget -O - https://debian.neo4j.org/neotechnology.gpg.key | sudo apt-key add -echo 'deb https://debian.neo4j.org/repo stable/' | sudo tee /etc/apt/sources.list.d/neo4j.listsudo apt-get update选择社区版安装安装过程时间比较长sudo apt-get install neo

2021-02-27 19:37:04 227

转载 NLP数据增强

文本中的数据增强NLP中小的扰动可能会对含义造成比较大的影响,比如:去掉或改变某个词,会导致整个句子的含义或情感发生巨大偏差。1.随机drop和shuffle drop:对于标题和描述中的字或词,随机的进行删除,用空格代替。另一种是 shuffle, 即打乱词序。对于"如何评价 2017 知乎看山杯机器学习比赛?" 这个问题,使用 drop 对词层面进行处理之后,可能变成"如何 2017 看山杯机器学习 “. 如果使用 shuffle 进行处理,数据就 可能变成"2017 机器学习?如何比赛知乎评价看

2021-02-25 14:04:52 361

原创 ubuntu安装搜狗输入法

后面有注意事项一、下载地址下载地址:https://pinyin.sogou.com/或者直接百度搜索“搜狗输入法”进入官网。二、下载和安装首页找到“输入法linux版”点击立即下载,下载最新版,根据官网提示一步一步安装。在官网安装过程中,如果出现不太顺利,请重启电脑,多尝试sudo apt-get install -f三、注意事项除了官网提到的需要修复apt,如果安装过程中出现报错信息:dpkg: error processing archive sogoupinyin_2.3.2.0

2021-02-04 23:55:45 229

原创 Xshell左侧侧边栏不见了

Xshell6左侧侧边栏突然不见了,在菜单栏点击-查看-会话管理器。如果菜单栏也不见了,使用快捷键Alt+E。

2021-01-11 09:27:38 17292 3

原创 A Transformer-based Approach for Source code Summarization 翻译

A Transformer-based Approach for Source Code Summarization 全文翻译本文最佳阅读方式:读完一段中文内容快速阅读对应的英文部分欢迎关注我的公众号:NLP小讲堂,扫码第一时间获取更多最新的文章。本文来自ACL 2020 Accepted Paper.https://arxiv.org/abs/2005.00653https://github.com/wasiahmad/NeuralCodeSum基于Transformer的源代码摘要生成摘要

2020-12-10 17:37:09 1166

原创 TensorFlow2.0的新特性

@[TOC)TensorFlow2.0的新特性2020年1月,TensorFlow迎来了2.0正式版的更新,新的框架在使用上与1.x差别较大,本文将对2.0的新特性进行一些总结,实时补充,与君共勉。新的改变相比于1.x版本,TensorFlow2.0主要有以下新的优点:更少的代码行数 。用户不再需要先建立静态图再运行,2.0的大部分代码被集成到不同的类和方法中,只需要执行简单几行,就可...

2020-01-28 17:52:28 265

转载 知识图谱嵌入(KGE):方法和应用的综述

https://blog.csdn.net/cf2SudS8x8F0v/article/details/100135669主要介绍了最近关于知识图谱嵌入所涉及到的研究方法,NLP发展至今,基于Pretraind的Embedding也已无法满足需求,单纯基于知识图谱的方式也具有局限性,如何将二者结合起来并落地进行应用显得格外重要,Makedowned....

2019-12-31 17:06:20 868

文本分类任务数据集,用于Transformers进行微调

文本分类任务数据集,用于Transformers进行微调

2022-11-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除