Linux 常用命令 linux常用的一些命令:命令解释find -name 文件名/目录名查找指定文件或目录wc -l `find -name 文件名`统计指定同一类型文件的各个文件的行数ps -aux查看进程ps -aux | grep 指定内容查看指定内容进程...
kaldi 中run_ivector_common kaldi 中run_ivector_common.sh在使用GMM-HMM对音频和文本进行对齐之后,在使用DNN网络的时候,kaldi中会加入说话人信息,一般用ivector特征,kaldi中run_ivector_common.sh 对特征做了进一步的处理:对特征进行速度上的扰动处理# perturb the normal data to get the alignment _sp ...
NLP常用特征提取方法对比 NLP 主要任务序列标注:分词/命名实体识别/语义角色标注…句子中每个单词要求模型根据上下文都要给出一个分类类别分类任务:文本分类/情感分析不管文章有多长,总体给出一个分类类别即可生成式子任务:翻译/摘要生成/写诗造句/看图说话输入文本内容后,需要自主生成另外一段文字句子关系判断:QA/自然语言推理给定两个句子,模型判断出两个句子是否具备某种语义关系NLP 特点NLP的输入...
Windows 用 Pip方式安装Pytorch 2018年4月25号,PyTorch 官方发布 0.4.0 版本,该版本的 PyTorch 有多项重大更新,其中最重要的改进是官方支持 Windows (详细改动见Pytorch官方GitHub):Tensor/Variable 合并零维张量数据类型迁移指南Windows 支持C++ 扩展ONNX 改进 支持 RNNBug修复与性能优化目前很多paper一开始出来的源码都是p...
跳跃游戏 跳跃游戏题目给定一个非负整数数组,你最初位于数组的第一个位置。数组中的每个元素代表你在该位置可以跳跃的最大长度。判断你是否能够到达最后一个位置。示例 1:输入: [2,3,1,1,4]输出: true解释: 我们可以先跳 1 步,从位置 0 到达 位置 1, 然后再从位置 1 跳 3 步到达最后一个位置。示例 2:输入: [3,2,1,0,4]输出: false解释: 无论...
接雨水 题目 接雨水链接:[link]给定 n 个非负整数表示每个宽度为 1 的柱子的高度图,计算按此排列的柱子,下雨之后能接多少雨水。上面是由数组 [0,1,0,2,1,0,1,3,2,1,2,1] 表示的高度图,在这种情况下,可以接 6 个单位的雨水(蓝色部分表示雨水)。 感谢 Marcos 贡献此图。解法一:从左往右遍历每一列,判断该列上的积水量,当前cur的高度,判断cur两边最高和最矮...
编辑距离 题目 编辑距离给定两个单词 word1 和 word2,计算出将 word1 转换成 word2 所使用的最少操作数 。你可以对一个单词进行如下三种操作:插入一个字符删除一个字符替换一个字符示例输入: word1 = "intention", word2 = "execution"输出: 5解释: intention -> inention (删除 't')inenti...
求算术平方根 题目 求算术平方根实现 int sqrt(int x) 函数。计算并返回 x 的平方根,其中 x 是非负整数。由于返回类型是整数,结果只保留整数的部分,小数部分将被舍去。示例输入: 8输出: 2说明: 8 的平方根是 2.82842..., 由于返回类型是整数,小数部分将被舍去。题解没什么就是二分查找的知识点,注意边界问题,二分查找记得使用右中位数class So...
经典问题生产者与消费者java并发线程模拟实现 生产者与消费者问题是操作系统中一个基础的问题。大致描述如下:生产者生产产品,消费者消费该产品。生产者只有等待消费者将产品消费完之后才能继续生产下一个产品,而消费者只有等带生产者生产完才能进行消费。生产者依赖于消费者,消费者依赖于生产者。 将该问题放到Java中来实现就是一个并发的多线程的问题,为了保证数据的完整性,需要借助线程同步的synchronized,用于控制数据同步时的一致。 同时为了保
OSI七层模型TCP/IP协议五层模型小结 网络中重要的基础知识:OSI和TCP/IP 一、OSI是Open System Interconnect的缩写,意为开放式系统互联,其遵循以下原则: 1、同一层中的个网络节点都有相同的层次结构,具有相同的功能; 2、同一节点内相邻层之间通过接口(逻辑接口)进行通信; 3、七层结构中的每一层都是使用下一层提供的服务,并为上一层提供服务; 4、不同节点的同等层按照协议实现对等层之间的通信。二、
Hadoop中Job提交过程 虽然写过多次的MR程序,但是未能很好的理解整个Hadoop中的Job的任务提交过程,查看了下源码,整理了下其job的提交过程,大致为:客户端向资源管理yarn申请资源,yarn分配好相应的资源,进行作业的运行,当作业运行完成时,yarn回收资源。具体如下: 1、客户端Client提交job,会执行代码中的job.awitforcompletion(),在客户端创建了一个RunJar的进程,
常见的排序算法小结 常见的排序算法小结一、根据时间复杂度对排序算法进行分类,其中N为数据样本个数 1、复杂度为平方阶O(N^2) 冒泡、选择、插入排序 2、复杂度为O(NlogN) 快速、堆、归并排序 3、复杂度为O(N^1+£) 希尔排序,其中£是介于0到1之间的 4、线性阶O(n) 桶、箱、基数排序二、排序算法稳定性分析 1、稳定性的算法: 插入排序、冒泡排序、归并排序、桶、基数排序 2、不稳
Spark RDD使用原则 如今随着数据量的不断增加,Hadoop已经难以满足处理需求,逐渐发展起来的Spark基于内存的并行计算已经得到了广泛的应用。Spark博大精深,编写起来比Hadoop方便很多,简单的几行代码就可以实现Hadoop复杂的代码,简单方便!著名的例子就是单词统计。对于Spark性能的调优部分可以查看美团点评团队写的文章http://tech.meituan.com/spark-tuning-basi
Spark 异常 serialVersionUID 不一致问题 在spark上运行程序出现如下异常(serialVersionUID不一致) Caused by: org.apache.spark.SparkException: Job aborted due to stage failure: Task 1 in stage 193.0 failed 4 times, most recent failure: Lost task 1.3 in stage 1
蘑菇阵(动态规划、百度)——unique paths 题目描述现在有两个好友A和B,住在一片长有蘑菇的由n*m个方格组成的草地,A在(1,1),B在(n,m)。现在A想要拜访B,由于她只想去B的家,所以每次她只会走(i,j+1)或(i+1,j)这样的路线,在草地上有k个蘑菇种在格子里(多个蘑菇可能在同一方格),问:A如果每一步随机选择的话(若她在边界上,则只有一种选择),那么她不碰到蘑菇走到B的家的概率是多少?输入描述: 第一行N,M,K(2 ≤ N