自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

VirusBenn的博客

随便玩玩,有缘更新。

  • 博客(15)
  • 收藏
  • 关注

原创 ChatGLM、ChatGLM2微调日记

微调是基于github的项目进行微调的。

2023-07-20 10:22:19 317

原创 【中文分词】 FMM & BMM (python)

1. 语料库准备 (需要的私聊博主)2.处理语料文档2.1处理多余字符def string_process(x): #处理字符串 a=re.sub(r'\d{8}-\d{2}-\d{3}-\d{3}/m|[/a-z!。”“,、——\[\]():《》……A-Z?]', "", x)#前面时间的正则表达式,后面部分删掉字母和其他符号 b=a.replace(" "," ") return b.rstrip()2.2 处理字典数据集def...

2021-10-22 20:43:22 631 1

原创 【 LeetCode 热题 HOT 100】 4.寻找两个正序数组的中位数(快慢指针)

1.题目描述给定两个大小分别为 m 和 n 的正序(从小到大)数组nums1 和nums2。请你找出并返回这两个正序数组的 中位数 。2.示例示例 1:输入:nums1 = [1,3], nums2 = [2]输出:2.00000解释:合并数组 = [1,2,3] ,中位数 2示例 2:输入:nums1 = [1,2], nums2 = [3,4]输出:2.50000解释:合并数组 = [1,2,3,4] ,中位数 (2 + 3) / 2 = 2.5示例 3:输入..

2021-10-21 19:52:13 83

原创 【论文研读】word2vec - Efficient Estimation of Word Representations in Vector Space

创新:传统的学习密集向量的模型的计算效率都比较低提出了两种新的模型体系结构来计算从非常大的数据集的词的连续向量表示,提出了新的“神经网络语言模型”,这里之所以打引号,是因为其实两个模型都没有隐藏层,只是看起来像是神经网络而已简介:许多当前的NLP系统和技术将单词视为原子单位——单词之间没有相似性的概念,因为它们在词汇表中被表示为索引。一个例子是用于统计语言建模的流行的N-gram模型——今天,可以在几乎所有可用的数据(万亿词[3])上训练N-gram。然而,简单的技术在许多任务中都有..

2021-10-08 20:24:15 103

原创 【论文研读】NNLM—A Neural Probabilistic Language Model

1.问题:统计语言建模的一个目标是学习语言中单词序列的联合概率函数。这在本质上是困难的,因为维数的诅咒:测试模型的word序列很可能与训练中看到的所有单词序列不同。我们建议通过学习一个分布式的词表示来克服维数的诅咒,它允许每个训练句子向模型告知一个指数数量的语义相邻句子N-gram它不考虑1到2个单词以外的上下文,1秒内它不考虑单词之间的“相似性”。2.介绍使用这些思想的实现依赖于共享参数的多层神经网络。本文的另一个贡献是关于如何将如此庞大的神经网络(包含数百万个参数)训练成非常庞大的数

2021-10-08 16:45:14 230

原创 【链表的实现及操作】Python版本

1.定义节点Class Node(object): def __init__(self, data = None, Next = None): self.data = data self.next = next2.定义链表及方法Class ListNode(object): def __init__(self): self.head = None // 顺序输出链表 def ListPrint(self):

2021-10-06 20:24:39 74

原创 【 LeetCode 热题 HOT 100】 3.无重复字符的最长子串(滑动窗口算法)

1.题目描述给定一个字符串 s ,请你找出其中不含有重复字符的最长子串的长度。2.示例示例 1:输入: s = "abcabcbb"输出: 3解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。示例 2:输入: s = "bbbbb"输出: 1解释: 因为无重复字符的最长子串是 "b",所以其长度为 1。示例 3:输入: s = "pwwkew"输出: 3解释: 因为无重复字符的最长子串是 "wke",所以其长度为 3。 请注意,你的答...

2021-10-06 09:57:28 81

原创 【二叉树初始化】dfs&bfs (Python实现)

1.二叉树初始化class TreeNode: def __init__(self, value=None, left=None, right=None): self.value = value # 根节点值 self.left = left # 左子树 self.right = right # 右子树2.DFS(以中序遍历为例)def midTraverse(root): if root is None:

2021-10-04 20:32:25 312

原创 【 LeetCode 热题 HOT 100】 2.两数相加

1.题目描述给你两个非空 的链表,表示两个非负的整数。它们每位数字都是按照逆序的方式存储的,并且每个节点只能存储一位数字。请你将两个数相加,并以相同形式返回一个表示和的链表。你可以假设除了数字 0 之外,这两个数都不会以 0开头。2.示例输入:l1 = [2,4,3], l2 = [5,6,4]输出:[7,0,8]解释:342 + 465 = 807.示例 2:输入:l1 = [0], l2 = [0]输出:[0]示例 3:输入:l1 = [9,9,...

2021-10-03 19:22:22 101

原创 【 LeetCode 热题 HOT 100】 1.两数之和

1.题目描述给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数,并返回它们的数组下标。你可以假设每种输入只会对应一个答案。但是,数组中同一个元素在答案里不能重复出现。你可以按任意顺序返回答案。2.示例示例 1:输入:nums = [2,7,11,15], target = 9输出:[0,1]解释:因为 nums[0] + nums[1] == 9 ,返回 [0, 1] 。示例 2:输入:nums =.

2021-10-01 19:03:27 72

原创 2020 蓝桥杯 省模拟赛 题解 python

第一题:问题描述 由1对括号,可以组成一种合法括号序列:()。  由2对括号,可以组成两种合法括号序列:()()、(())。  由4对括号组成的合法括号序列一共有多少种?答案:14()()()(),())()(),()(())(),()()(()),(()()()),(()())(),()(()()),(())(()),((()))()、()((()))、((())...

2020-04-25 16:52:15 1842

原创 大数据——Windows下搭建Spark环境

版本:jdk 1.8 scala 2.13.1 hadoop 2.9.2 spark 3.0JDK官网下载后配置环境变量(略)Scala官方地址http://www.scala-lang.org/download/2.11.8.html下载解压后配置环境变量Hadoop官方http://hadoop.apache.org/releases.html同...

2020-04-01 16:34:35 246

转载 Python 必备内置函数大全

为了方便记忆,将这些内置函数进行了如下分类: 数学运算(7个) 类型转换(24个) 序列操作(8个) 对象操作(7个) 反射操作(8个) 变量操作(2个) 交互操作(2个) 文件操作(1个) 编译执行(4个) 装饰器(3个)...

2020-03-14 23:21:37 182

原创 Python 实现经典排序算法

稳定性:稳定的排序算法:冒泡排序、插入排序、归并排序和基数排序。不是稳定的排序算法:选择排序、快速排序、希尔排序、堆排序。本文章介绍冒泡和选择排序。冒泡排序: 比较相邻的元素。如果第一个比第二个大,就交换他们两个。 对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对。这步做完后,最后的元素会是最大的数。 针对所有的元素重复以上的步骤,除了最后一个。...

2020-03-14 22:52:02 162

原创 2020 蓝桥杯 校内模拟赛(部分题解)

第一题 问题描述  1200000有多少个约数(只计算正约数)。 答案提交  这是一道结果填空的题,你只需要算出结果后提交即可。本题的结果为一个整数,在提交答案时只填写这个整数,填写多余的内容将无法得分。 解析:整数a除以整数b(b≠0) 除得的商正好是整数而没有余数,我们就说a能被b整除,或b能整除a。a称为b的倍数,b称为a的约数。...

2020-03-14 16:16:27 4422

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除