自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 LeetCode Weekly Contest 190

5416. 检查单词是否为句中其他单词的前缀 给你一个字符串 sentence 作为句子并指定检索词为 searchWord ,其中句子由若干用 单个空格 分隔的单词组成。 请你检查检索词 searchWord 是否为句子 sentence 中任意单词的前缀。 如果 searchWord 是某一个...

2020-05-24 12:16:39 14 0

原创 [maven] 使用maven-shade-plugin将依赖打包到jar包

写在前面 这是笔者第一次使用纯命令行构建maven项目,可能有疏漏或者错误的地方,望读者指正! 问题描述 一个maven项目,用命令 java -cp ${TARGET_JAR_PATH} ${MAIN_CLASS} 运行报错:java.lang.NoClassDefFoundError: Ja...

2020-05-21 15:40:47 39 0

原创 git本地账号管理

在使用git时,一个人可能拥有多个git账号(例如一个是个人账号,一个是公司内部账号),如果不关心提交时的账号,容易造成混乱,给多人项目开发带来不便。因此,有必要掌握查看、修改本地账号的git命令。 查看本地git账号: 查看git用户名:git config user.name 查看git用户...

2020-05-17 20:25:07 19 0

原创 LeetCode第 26 场双周赛

5396. 连续字符 题目难度Easy 给你一个字符串 s ,字符串的「能量」定义为:只包含一种字符的最长非空子字符串的长度。 请你返回字符串的能量。 示例 1: 输入:s = “leetcode” 输出:2 解释:子字符串 “ee” 长度为 2 ,只包含字符 ‘e’ 。 示例 2: 输入:s =...

2020-05-17 07:17:42 23 0

原创 [spark] repartition与partitionBy的区别

Spark中,repartition和partitionBy都是重新分区的算子,其中partitionBy只能作用于PairRDD. 但是,当作用于PairRDD时,repartition和partitionBy的行为是不同的。repartition是把数据随机打散均匀分布于各个Partition...

2020-05-15 11:24:40 35 0

原创 [Linux] 文件校验命令

Linux下文件校验(文件完整性检查)命令有crc32, md5sum, sha1sum, cksum等等。其中crc32和cksum在macOS上也有。 命令 校验算法 格式 输出 mac是否可用 crc32 CRC crc32 $FILENAME 校验值 文件名 √ md5...

2020-05-13 15:45:18 29 0

原创 LeetCode Weekly Contest 188

5404. 用栈操作构建数组 给你一个目标数组 target 和一个整数 n。每次迭代,需要从 list = {1,2,3…, n} 中依序读取一个数字。 请使用下述操作来构建目标数组 target : Push:从 list 中读取一个新元素, 并将其推入数组中。 Pop:删除数组中的最后一个...

2020-05-10 16:26:12 37 0

原创 LeetCode Weekly Contest 187

5400. 旅行终点站 给你一份旅游线路图,该线路图中的旅行线路用数组 paths 表示,其中 paths[i] = [cityAi, cityBi] 表示该线路将会从 cityAi 直接前往 cityBi 。请你找出这次旅行的终点站,即没有任何可以通往其他城市的线路的城市。 题目数据保证线路图会...

2020-05-03 15:16:04 39 0

原创 Airbnb个性化搜索推荐:Real-time Personalization using Embeddings for Search Ranking at Airbnb

Airbnb个性化搜索推荐:Real-time Personalization using Embeddings for Search Ranking at Airbnb 概述 KDD’2018 Best Paper Airbnb的一个工业级工作,算法设计和Airbnb自身的业务有比较强的耦合 ...

2020-04-27 20:04:14 47 0

原创 LeetCode Weekly Contest 186

5392. 分割字符串的最大得分 给你一个由若干 0 和 1 组成的字符串 s ,请你计算并返回将该字符串分割成两个 非空 子字符串(即 左 子字符串和 右 子字符串)所能获得的最大得分。 「分割字符串的得分」为 左 子字符串中 0 的数量加上 右 子字符串中 1 的数量。 示例 1: 输入:s ...

2020-04-26 12:39:38 82 0

原创 Google kick start 2020 Round B

Bike Tour (5pts, 7pts) Problem Li has planned a bike tour through the mountains of Switzerland. His tour consists of N checkpoints, numbered from 1 t...

2020-04-19 17:21:18 153 0

原创 LeetCode Weekly Contest 185

5388. 重新格式化字符串 给你一个混合了数字和字母的字符串 s,其中的字母均为小写英文字母。 请你将该字符串重新格式化,使得任意两个相邻字符的类型都不同。也就是说,字母后面应该跟着数字,而数字后面应该跟着字母。 请你返回 重新格式化后 的字符串;如果无法按要求重新格式化,则返回一个 空字符串 ...

2020-04-19 16:50:55 73 0

原创 Google kick start 2020 Round A

写在前面 第一次做kick start,写一下kick start的规矩: Java的类名必须是Solution 2020年开始改成3个小时4个题,小数据和大数据的结果都立刻可见 要自己处理输入输出 代码编辑框不能粘贴 Allocation Problem There are N houses...

2020-04-19 06:59:56 101 0

原创 LeetCode 1240. 铺瓷砖(深搜剪枝)

1240. 铺瓷砖 你是一位施工队的工长,根据设计师的要求准备为一套设计风格独特的房子进行室内装修。 房子的客厅大小为 n x m,为保持极简的风格,需要使用尽可能少的 正方形 瓷砖来铺盖地面。 假设正方形瓷砖的规格不限,边长都是整数。 请你帮设计师计算一下,最少需要用到多少块方形瓷砖? 示例 1...

2020-04-17 19:33:05 258 0

原创 LeetCode Weekly Contest 184

5380. 数组中的字符串匹配 给你一个字符串数组 words ,数组中的每个字符串都可以看作是一个单词。请你按 任意 顺序返回 words 中是其他单词的子字符串的所有单词。 如果你可以删除 words[j] 最左侧和/或最右侧的若干字符得到 word[i] ,那么字符串 words[i] 就是...

2020-04-12 13:18:02 29 0

原创 LeetCode Weekly Contest 183

5376. 非递增顺序的最小子序列 给你一个数组 nums,请你从中抽取一个子序列,满足该子序列的元素之和 严格 大于未包含在该子序列中的各元素之和。 如果存在多个解决方案,只需返回 长度最小 的子序列。如果仍然有多个解决方案,则返回 元素之和最大 的子序列。 与子数组不同的地方在于,「数组的子序...

2020-04-05 15:36:45 34 0

原创 [macOS] 解决unzip无法解压GBK编码的中文路径名问题

问题描述 在macOS上用unzip $ZIPFILE.zip命令解压文件,当ZIPFILE.zip中的路径/文件名含有中文且中文是GBK编码时,会报类似下面的错误 checkdir error: cannot create ޻??+? Illegal byte sequence unable ...

2020-04-04 09:06:16 195 0

原创 [macOS] HomeBrew更换国内源

HomeBrew是macOS下的包管理软件,默认源是国外站点,速度较慢且不稳定,通过更换国内源的方式,可以提高下载速度和成功率。以中科大镜像站为例说明更换国内源的步骤。 cd "$(brew --repo)" git remote set-url origin https://...

2020-04-04 08:49:35 149 0

原创 Hive知识点整理

Hive知识点整理 简介 Hive解决的问题是海量结构化日志的数据处理 基于Hadoop的一个数据仓库工具,将结构化数据映射为一张表,提供HQL的类SQL查询功能 Hive的数据存储在HDFS上 Hive计算逻辑的底层默认实现是MapReduce Hive由Yarn调度 Hive相当于Hadoo...

2020-03-31 13:43:39 58 0

原创 LeetCode Weekly Contest 182

5368. 找出数组中的幸运数 在整数数组中,如果一个整数的出现频次和它的数值大小相等,我们就称这个整数为「幸运数」。 给你一个整数数组 arr,请你从中找出并返回一个幸运数。 如果数组中存在多个幸运数,只需返回 最大 的那个。 如果数组中不含幸运数,则返回 -1 。 示例 1: 输入:arr =...

2020-03-30 10:54:21 59 0

原创 HDU2089. 不要62(数位dp)

不要62 Problem Description 杭州人称那些傻乎乎粘嗒嗒的人为62(音:laoer)。 杭州交通管理局经常会扩充一些的士车牌照,新近出来一个好消息,以后上牌照,不再含有不吉利的数字了,这样一来,就可以消除个别的士司机和乘客的心理障碍,更安全地服务大众。 不吉利的数字为所有含有4或...

2020-03-29 22:31:47 80 0

原创 LeetCode 403. 青蛙过河(动态规划)

青蛙过河 一只青蛙想要过河。 假定河流被等分为 x 个单元格,并且在每一个单元格内都有可能放有一石子(也有可能没有)。 青蛙可以跳上石头,但是不可以跳入水中。 给定石子的位置列表(用单元格序号升序表示), 请判定青蛙能否成功过河(即能否在最后一步跳至最后一个石子上)。 开始时, 青蛙默认已站在第一...

2020-03-29 11:55:34 85 0

原创 源码安装pytorch_scatter, pytorch_cluster

动机 笔者使用清华镜像站作为pip源,直接pip install torch_scatter和pip install torch_cluster安装不成功,考虑使用源码安装。下面以安装pytorch_cluster-1.4.5为例说明源码安装过程,pytorch_scatter的源码安装方式类似。...

2020-03-24 17:45:00 140 0

原创 源码编译安装python2.7替换Hadoop集群的python2.6

背景 使用Hadoop streaming + python开发,集群节点的python是python2.6,语法与python2.7略有不同。而我本地和开发机的python版本都是python2.7,考虑到Hadoop streaming支持分发压缩文件到节点,因此打算自己制作一个python2...

2020-03-23 12:05:59 59 0

原创 Yarn知识点整理

Yarn知识点整理 Yarn是一个资源调度平台,负责为计算框架提供服务器运算资源,相当于一个分布式操作系统平台,而MapReduce相当于应用程序。Yarn在Hadoop2之后引入MapReduce. 基本架构 ResourceManager: 处理客户端请求 监控NodeManager状态 ...

2020-03-22 21:03:45 40 0

原创 LeetCode Weekly Contest 181

5364. 按既定顺序创建目标数组 给你两个整数数组 nums 和 index。你需要按照以下规则创建目标数组: 目标数组 target 最初为空。 按从左到右的顺序依次读取 nums[i] 和 index[i],在 target 数组中的下标 index[i] 处插入值 nums[i] 。 重复...

2020-03-22 16:37:04 51 0

原创 MapReduce知识点整理

MapReduce知识点整理 基于版本:Hadoop 2.7.2 序列化 Q: 为什么Hadoop不使用Java自带的序列化? A: Java自带的序列化框架过于重量级(附带很多额外信息:校验信息、Header、继承体系等),网络传输效率低,所以Hadoop自己实现了序列化机制(Writable接...

2020-03-17 15:31:14 62 0

原创 LeetCode Weekly Contest 180

5356. 矩阵中的幸运数 给你一个 m * n 的矩阵,矩阵中的数字 各不相同 。请你按 任意 顺序返回矩阵中的所有幸运数。 幸运数是指矩阵中满足同时下列两个条件的元素: 在同一行的所有元素中最小 在同一列的所有元素中最大 示例 1: 输入:matrix = [[3,7,8],[9,11,13]...

2020-03-15 17:02:25 39 0

原创 HDFS知识点整理

HDFS知识点整理 优缺点 优点 高容错性:多副本,自动恢复 处理的数据规模大:可处理PB级别的文件,可支持百万级数量的文件 缺点 不适合低延迟的数据访问 无法高效存储小文件 文件元数据过多,耗尽NameNode内存 小文件寻址超过文件读取时间,违背HDFS设计初衷 不支持并发...

2020-03-11 17:55:25 53 0

原创 论文解析:Neural Graph Collaborative Filtering

论文解析:Neural Graph Collaborative Filtering 作者:Xiang Wang, Xiangnan He, Meng Wang, Fuli Feng, Tat-Seng Chua(新加坡国立大学) 会议:SIGIR 2019 方法 和Graph Convolut...

2020-03-11 12:26:31 184 0

原创 论文解析:Graph Convolutional Matrix Completion

论文解析:Graph Convolutional Matrix Completion 作者:Rianne van den Berg, Thomas N. Kipf, Max Welling(也是发表GCN的团队) 会议:KDD 2018 方法 图变分自编码器(GAE)的应用(GAE的博客),算...

2020-03-11 11:11:30 241 0

原创 论文解析:Variational Graph Auto-Encoders

论文:Variational Graph Auto-Encoders阅读笔记 作者:Thomas N. Kipf, Max Welling, 和GCN的作者是一样的 会议:Bayesian Deep Learning Workshop (NIPS 2016), NIPS的一个workshop,不...

2020-03-09 18:04:26 298 0

原创 LeetCode Weekly Contest 179

5352. 生成每种字符都是奇数个的字符串 题目难度Easy 给你一个整数 n,请你返回一个含 n 个字符的字符串,其中每种字符在该字符串中都恰好出现 奇数次 。 返回的字符串必须只含小写英文字母。如果存在多个满足题目要求的字符串,则返回其中任意一个即可。 示例 1: 输入:n = 4 输出:“p...

2020-03-08 12:55:05 81 0

原创 [Linux] paste命令合并两个行数相同的文件

paste命令可以用于合并两个行数相同的文件到标准输出,两个文件的每行分别对齐,默认用\t分隔,使用-d参数可以指定分隔符。 Example 1: cat a.txt 123 234 456 cat b.txt a b a c b d paste a.txt b.txt > c.txt ...

2020-03-05 09:21:36 77 0

原创 Python3 sort自定义比较函数

许多语言(例如C++/Java)的sort函数/方法都支持自定义比较类/函数,Python2的list的sort方法也支持可选参数cmp,支持用户自定义比较函数,但是Python3中删除了可选参数cmp,同时也删除了内置函数cmp,只提供了可选参数key用于自定义排序。但是,有些排序需求用cmp实...

2020-03-04 11:36:04 465 0

原创 多分类中accuary与micro F1-score的恒等性

发现在多分类问题(这里『多分类』是相对于『二分类』而言的,指的是类别数超过2的分类问题)中,用sklearn的metrics.accuracy_score(y_true, y_pred)和float(metrics.f1_score(y_true, y_pred, average="mi...

2020-03-02 17:54:25 365 0

原创 使用pip freeze导出Python项目依赖环境

导出 导出依赖到文件requirements.txt pip freeze >requirements.txt requirements.txt中的内容示例: docutils==0.11 Jinja2==2.7.2 MarkupSafe==0.19 Pygments==1.6 Sphin...

2020-03-02 16:19:26 182 0

原创 LeetCode Weekly Contest 178

5344. 有多少小于当前数字的数字 给你一个数组 nums,对于其中每个元素 nums[i],请你统计数组中比它小的所有数字的数目。 换而言之,对于每个 nums[i] 你必须计算出有效的 j 的数量,其中 j 满足 j != i 且 nums[j] < nums[i] 。 以数组形式返回...

2020-03-01 16:07:53 97 0

原创 记一次Python多进程调优实践(自己实现并行KNN算法)

记一次Python多进程调优实践(自己实现并行KNN算法) 环境 服务器硬件:16核CPU,192GB内存 操作系统:Ubuntu 16.04 Python版本:3.6.5 numpy版本:1.14.3 为什么使用多进程和共享内存 工作中需要写一个knn算法,用numpy实现,数据量N过大(N...

2020-02-28 17:04:00 169 0

原创 vscode多行操作快捷键

版本声明:vscode 1.41.1 Mac版 vscode多行操作快捷键笔者经常忘记,因此写下这个博客提醒自己。 vscode多行快捷键可以通过菜单栏的『Help』-『Interactive Playground』打开Interactive Playground页面查看 在打开的Interac...

2020-02-26 15:53:27 278 0

提示
确定要删除当前文章?
取消 删除