自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(39)
  • 收藏
  • 关注

原创 排序问题总结 - CSNotes

补充:堆排序(升序,降序,迭代,递归写法)https://blog.csdn.net/unspoken0714/article/details/107921229第K大的元素或者第K个最大元素可用堆排或快速选择(快排+二分)的解法。堆排:第K大的元素用最小堆或最大堆,冒K次,时间复杂度 = 建堆时间+调整堆k次 = O(n)+ O(Klogn)第K个最大元素用最大堆或最小堆,冒K次,时间复杂度一样如果是用迭代实现堆的heapify,空间复杂度为O(1),堆排序是原地排序。import

2021-03-31 18:52:42 88

原创 HMM代码 - HanLP

HanLP HMM 代码,包括概率计算(计算观测序列的条件概率)、学习(最有可能的模型参数)、预测问题(给定观测序列和模型参数,最有可能的状态序列)。/* * <author>Han He</author> * <email>me@hankcs.com</email> * <create-date>2018-06-09 7:47 PM</create-date> * * <copyright file="HiddenM

2021-03-31 14:54:50 479

原创 医药知识图谱

问答系统:

2021-03-31 09:58:05 644

原创 二分查找总结题型 - CSNotes

二分查找有很多细节要注意。x的平方根对于 x = 8,它的开方是 2.82842…,最后应该返回 2 而不是 3。在循环条件为 l <= h 并且循环退出时,h 总是比 l 小 1,也就是说 h = 2,l = 3,因此最后的返回值应该为 h 而不是 l。解法一:class Solution: def mySqrt(self, x: int) -> int: # 直接返回的情况 if x <= 1: return

2021-03-28 23:23:37 152

原创 最大值,最小值 初始化

MAX:用于初始化一个求min的变量MIN:用于初始化一个求max的变量C++INT_MAX, INT_MINJAVAInteger.MAX_VALUE 和 Integer.MIN_VALUEJava Integer取值范围是:[-2147483648, 2147483647]PYTHONfloat(“inf”), float("-inf")

2021-03-28 18:42:02 1022

原创 最长公共子序列

返回最长公共子序列的长度leetcode 1143class Solution: def longestCommonSubsequence(self, text1: str, text2: str) -> int: m, n = len(text1), len(text2) dp = [[0] * (n + 1) for _ in range(m + 1)] for i in range(1, m + 1): ..

2021-03-28 11:38:02 123

转载 python变量的作用域:局部变量和全局变量

变量定义以后,是有一定的使用范围,称之为变量的作用域。比如Java中,变量的使用范围是变量声明时所在的{}范围,而python的作用域对应的为同一个缩进。按着变量的使用范围给变量划分成如下两种: 1.全局变量:就是在函数外部定义的变量 2.局部变量:就是在函数内部定义的变量全局函数和局部函数的作用域局部变量作用域:只能在被声明的函数内部访问,函数外部使用不了。这也是不同函数里可以定义名称一样变量的原因全局变量作用域:可以在整个程序范围内访问,任意函数都可以访问原文链接

2021-03-27 16:53:14 245

原创 二叉树的层序遍历及变体

层序遍历知识点:python3的deque:https://blog.csdn.net/langb2014/article/details/100118296模板:popleft一个节点,append自己的value到level数组中(遍历该层),然后append所有他的子节点到queue中(queue存下一层的节点);将一层的节点都popleft后,将level数组存入res数组(将该层节点值加入结果数组)。python:# Definition for a binary tree node.

2021-03-24 15:58:44 150

原创 最大连续子数组和,最大连续子数组乘积

最大连续子数组和动态规划的是首先对数组进行遍历,当前最大连续子序列和为 sum,结果为 ans如果 sum > 0,则说明 sum 对结果有增益效果,则 sum 保留并加上当前遍历数字如果 sum <= 0,则说明 sum 对结果无增益效果,需要舍弃,则 sum 直接更新为当前遍历数字每次比较 sum 和 ans的大小,将最大值置为ans,遍历结束返回结果维护两个变量,在动态规划过程中,一个是tmp_sum即降维了的dp数组dp[i], 一个是最终答案ans。每个i都要记得更新一.

2021-03-24 15:55:58 267

转载 Batch Norm、Layer Norm、Instance Norm、Group Norm、Switchable Norm总结

原文:https://blog.csdn.net/qq_41997920/article/details/899459721.综述在入门深度学习时就深度学习中的一些概念做了一些介绍,但随着学习的不断深入,一些网络优化的技巧越来越多,才发现之前的理解的不够深入。在这里有对BN的理解,对出现的几种归一化进行一些个人理解的介绍,首先看一个直观图归一化层,目前主要有这几个方法,Batch Normalization(2015年)、Layer Normalization(2016年)、Instance Nor

2021-03-23 18:38:30 195

原创 腾讯一面:BERT模型压缩,BERT变种,数据分桶

BERT模型蒸馏有哪些方法?https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/109039823BERT变种https://blog.csdn.net/qq_39006282/article/details/107251957数据分桶https://blog.csdn.net/fang156239305/article/details/107315666/

2021-03-23 11:52:50 486

原创 bert-as-service & BERT FAQ

官方github:https://github.com/hanxiao/bert-as-service#q-the-cosine-similarity-of-two-sentence-vectors-is-unreasonably-high-eg-always–08-whats-wronghttps://mp.weixin.qq.com/s/E60wUHkHo-Gj3wb9Denuag

2021-03-22 17:55:03 256

原创 X数之和

1. 两数之和TwoSum时间:O(n)来自遍历整个数组,每次遍历都查找一次hashset用时O(1) 空间:O(n)来自hashset存储之前遍历过的元素重点在这一段:Hashset对于每一个遍历的元素num,都在之前遍历过的并存入map中的元素们中找有没有target - num,如果有,返回[hashtable[target - num], i], 如果没有,将当前遍历的元素以(key,value) = (nums[i], i)的形式存入map。if target - num in ha

2021-03-22 17:54:22 277

原创 运算优先级

移位运算的优先级小于加减运算的优先级,运算时先进行加减!!所以要写成:mid = left + ((right - left) >> 1)reference:https://blog.csdn.net/yiqzq/article/details/81144342

2021-03-21 17:52:19 244

原创 3.21字节跳动笔试

二分答案#include<bits/stdc++.h>using namespace std;bool check(vector<long long>& a, long long mid){ long long temp; for(int i=0; i<a.size()-1; i++){ temp = min(a[i]*2, mid/2); if(a[i]>temp) return false; .

2021-03-21 16:02:43 799 2

转载 编程机试输入输出模板-python3

转载自:https://blog.csdn.net/weixin_43297257/article/details/105591319单输入输入形式16AC输入模板# 输入一个数字,int: 16a = int(input())# 输入一个字符/字符串,str: ACc = input()12345单行输入输入形式2 8 1ABC CSA输入模板# 输入多位数字,直接得到 list[int]:[2,8,1]line = list(map(int,i

2021-03-19 22:55:30 247

转载 Python中单引号,双引号,3个单引号及3个双引号的区别

转载自:https://blog.csdn.net/woainishifu/article/details/76105667单引号和双引号在Python中我们都知道单引号和双引号都可以用来表示一个字符串,比如str1 = ‘python’str2 = “python”str1和str2是没有任何区别的。我们知道Python以其易用性而著名,所以刚开始看教程学习看到单引号和双引号都可以使用会以为这是Python为了方便程序员,随便用哪个就好,不用担心用错。其实,背后的原因不只是这么简单。举个例子,

2021-03-19 22:32:39 120

原创 DFS

岛屿in-place(在原数组上进行修改). 若不能直接修改board,则需要一个标记数组(初始化为全0),遍历过的地方标记为1,如果这个标记数组对应的位置(i,j)不为0,那么表示这个地方已经遍历过.停止条件改为:if not 0 <= i < len(grid) or not 0 <= j < len(grid[0]) or grid[i][j] == '0' or visited[i][j] == '1': returnclass Solution: .

2021-03-19 14:37:57 72

转载 排序算法总结图

转自:https://blog.csdn.net/HuoYiHengYuan/article/details/104479754在排序算法中,我们可能会遇到In-place和Out-placein-place 占用常数内存,不占用额外内存out-place 占用额外内存In-place假如问题规模是n,在解决问题过程中,只开辟了常数量的空间,与n无关,这是原址操作,就是In-place。例如在冒泡排序中,为了将arr排序,借用了一个temp的临时变量,开辟了一个临时空间,这个空间是常数量,这就

2021-03-18 15:49:29 181

原创 并查集 - 解决连通性问题

给的输入形式不同,但都是利用并查集,并查集的实现是不变的。1) 323. 无向图中连通分量的数目给定编号从 0 到 n-1 的 n 个节点和一个无向边列表(每条边都是一对节点),请编写一个函数来计算无向图中连通分量的数目。class UnionFind: def __init__(self, n): self.n = n self.part = n self.parent = [x for x in range(n)] self

2021-03-17 11:29:14 268

原创 螺旋矩阵生成

螺旋矩阵I:按螺旋顺序返回矩阵所有元素可以模拟螺旋矩阵的路径。初始位置是矩阵的左上角,初始方向是向右,当路径超出界限或者进入之前访问过的位置时,顺时针旋转,进入下一个方向。判断路径是否进入之前访问过的位置需要使用一个与输入矩阵大小相同的辅助矩阵 visited,其中的每个元素表示该位置是否被访问过。当一个元素被访问时,将visited 中的对应位置的元素设为已访问。如何判断路径是否结束?由于矩阵中的每个元素都被访问一次,因此路径的长度即为矩阵中的元素数量,当路径的长度达到矩阵中的元素数量时即为完整.

2021-03-17 11:15:10 219

原创 python 方法中的变量与self.变量的区别

原文地址:https://www.cnblogs.com/xdd1997/p/13585295.html>>> class AAA(object):... def go(self):... self.one = 'hello'...>>> class BBB(object):... def go(self):... one = 'hello'...>>> a1 = AAA()>&g

2021-03-17 09:20:31 447

转载 nums和nums[:]

python区别nums = A和nums[:] = Anums = A 更改nums这一变量名所指的对象,让nums变量指向A所指向的对象nums[:] = A 对nums指向的对象赋值,把A变量指向的对象的值逐个复制到nums指向的对象中并覆盖nums指向的对象的原来值。nums[:] 等价于 nums[0:len(nums)] 相当于取nums对应对象的一个视图,通过用这个来改变原对象的某几位值。如:A[:2] = [0, 1],改变了A所指向的list对象的前两个值。A = [0 ,1],

2021-03-17 09:05:08 362

原创 leetcode系列 - 数据结构 - 2. 树

树的递归问题1)104:maxDepth数的最大深度(数节点数)# Definition for a binary tree node.# class TreeNode:# def __init__(self, val=0, left=None, right=None):# self.val = val# self.left = left# self.right = right# count the number of nodes.

2021-03-15 22:42:34 82

原创 多数求和 leetcode 15 16 18

1. 三数之和:排序 + 双指针算法流程:特判,对于数组长度 nn,如果数组为 nullnull 或者数组长度小于 33,返回 [][]。对数组进行排序。遍历排序后数组:若 nums[i]>0nums[i]>0:因为已经排序好,所以后面不可能有三个数加和等于 00,直接返回结果。(去重1)对于重复元素:跳过,避免出现重复解令左指针 L=i+1L=i+1,右指针 R=n-1R=n−1,当 L<RL<R 时,执行循环:当 nums[i]+nums[L]+nums[R]

2021-03-14 10:49:42 283

原创 二叉树的前中后序遍历(利用自定义栈)

1. python写法以中序遍历为例:# Definition for a binary tree node.# class TreeNode:# def __init__(self, val=0, left=None, right=None):# self.val = val# self.left = left# self.right = rightclass Solution: def inorderTraversal(se

2021-03-13 20:31:22 132

原创 PCA李宏毅笔记

https://blog.csdn.net/code_caq/article/details/79636136wiki:

2021-03-12 10:41:28 122

转载 使用sorted和OrderedDict 对字典排序

使用sorted和OrderedDict 对字典排序https://blog.csdn.net/qq_34732088/article/details/79917192test = {1: "a", 3: "d", 6: "g", 2: "c", 5: "e", 0: "f", 4: 'b'}# 对字典的key值列表排序,返回列表print(sorted(test.keys()))# 对字典的键值对元组列表排序,按元组的第1个元素排序,也就是 key# 返回的是一个元组列表print(so

2021-03-11 12:36:24 225

转载 Linux常用命令(面试题)

https://blog.csdn.net/qq_40910541/article/details/80686362

2021-03-11 10:46:59 320

原创 BERT分词,wordpiece,BPE,jieba,pkuseg

BERT分词摘自:https://blog.csdn.net/u010099080/article/details/102587954BERT 源码中 tokenization.py 就是预处理进行分词的程序,主要有两个分词器:BasicTokenizer 和 WordpieceTokenizer,另外一个 FullTokenizer 是这两个的结合:先进行 BasicTokenizer 得到一个分得比较粗的 token 列表,然后再对每个 token 进行一次 WordpieceTokenizer,

2021-03-08 11:45:09 4817

原创 python正则表达式

细说python正则表达式https://www.jianshu.com/p/147fab022566

2021-03-07 14:46:15 70

原创 if x is not None, is not, !=

Python中if x&if x is not nonehttps://zhuanlan.zhihu.com/p/80369221python代码if not x: 和if x is not None:和if not x is None:使用https://blog.csdn.net/sasoritattoo/article/details/12451359

2021-03-05 21:23:21 142

原创 NLP面试准备

HMM, MEMM, CRF p132CRF,HMM(隐马模型),MEMM(最大熵隐马模型)都常用来做序列标注的建模,像分词、词性标注,以及命名实体标注隐马模型一个最大的缺点就是由于其输出独立性假设,导致其不能考虑上下文的特征,限制了特征的选择最大熵隐马模型则解决了隐马的问题,可以任意选择特征,但由于其在每一节点都要进行归一化,所以只能找到局部的最优值,同时也带来了标记偏见的问题,即凡是训练语料中未出现的情况全都忽略掉。条件随机场则很好的解决了这一问题,他并不在每一个节点进行归一化,而是所有特征.

2021-03-05 16:22:16 209 1

原创 Character-level recurrent sequence-to-sequence model (char-level机器翻译,seq2seq模型,LSTM)

理解encoder_outputs, state_h, state_c = encoder(encoder_inputs)的三个输出:https://huhuhang.com/post/machine-learning/lstm-return-sequences-stateinputs = tf.keras.layers.Input(shape=(3, 1))lstm = tf.keras.layers.LSTM(1, return_state=True)(inputs)model = tf.ke

2021-03-03 18:46:38 176

原创 对ndarray索引的操作

In python, x[(exp1, exp2, …, expN)] is equivalent to x[exp1, exp2, …, expN]. (exp1, exp2, …, expN) is called selection tuple.不同dim用逗号","隔开对某一dim切片取索引用i:j:ki是起始索引,j是结束索引,k是间隔(每k个元素取一个)如果i或j是负数,就是倒数第|i|或|j|个数,index = n + i and n + j where n is the numbe

2021-03-03 18:45:27 431 1

原创 pycharm debug功能

Frame窗格:显示了正在运行的函数调用,存储了函数的局部变量和参数。当py文件中有多个函数时,切换frame来观察不同函数:是文件,其余是函数variable和watches:变量窗口经常有很多变量,查找某变量不方便。这时可以打开watch窗口只观察关注的变量。用于当前调试会话的内置python shell:(请注意屏幕截图上的绿色>>>),您可以在其中访问当前作用域中的所有变量,并执行通常在Python shell中执行的所有操作Evaluate Expression:①、可以.

2021-03-03 18:00:31 127 1

原创 python牛客网输入输出处理

python 去除字符串中指定字符https://blog.csdn.net/zdz0200/article/details/81453367赛码网和牛客网python输入输出要求https://blog.csdn.net/zdz0200/article/details/82150861牛客网推荐使用sys.stdin.readline()形式输入,输出用print()n, m = map(int, sys.stdin.readline().strip().split())'''输入:2 3

2021-03-01 19:47:36 1804

原创 dropout

reference:https://www.jianshu.com/p/f7d71f6c5ffc

2021-03-01 15:09:15 97

原创 中文NER问题的解决方案

baseline: BiLSTM+CRF or BERT+BiLSTM+CRF模型之外,如何提升标注效果?在垂直领域,一个不断积累、不断完善的实体词典对NER性能的提升是稳健的,基于规则+词典也可以快速应急处理一些badcase对于通⽤领域,可以多种分词工具和多种句法短语⼯具进行融合来提取候选实体,并结合词典进行NER。此外,怎么更好地将实体词典融入到NER模型中,也是一个值得探索的问题(如嵌入到图神经网络中提取特征[3])。如何在模型层面提升NER性能?NER是一个重底层的任务,我们应

2021-03-01 15:08:22 1603

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除