自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 【leetcode】模拟计算器类题目

一、表达式里只包含加减程除运算符,不包含括号比较简单,先计算乘除再计算加减这道题要注意的是,他给出的表达式是个字符串的形式,比如"42"要被识别成42而不能是4和2class Solution: def calculate(self, s): """ :type s: str

2018-10-30 19:18:24 682

原创 Spark save result to Local file System but only SUCCESS

运行如下代码,把结果保存到本地文件系统而不是HDFS上,但是结果中只有success文件没有内容文件 val data1 =sc.parallelize(Array(("a",1),("b",1),("c",1),("d",1))) .map(x=>x._1 + x._2.toString) .repartition(1)data1.saveAsT...

2018-10-29 11:10:23 895

原创 Spark先分区再排序

记录目的在于弄清楚spark 排序后再partition会不会导致原来的顺序改变(是不会改变的),从而达到数据按照某个属性分区,并且分区后内部是按照其他属性排好序的数据为DF格式时代码 val spark =SparkSession.builder().config(new SparkConf()).getOrCreate() val sc =spark.sparkConte...

2018-10-27 14:08:18 3961

原创 【leetcode】925. Long Pressed Name

题目如下:简单的双指针问题,记录这道题的目的记录这道题的目的不是题目本身,而是代码上的问题,AC代码中肯定会涉及指针的移动,分两种情况,不能呢个匹配时指针要向前移动,这个指针移动是在while循环里的,如果匹配上了指針也要向前移動,這個移動是在while外面的,对这同一指针的两种情况都要进行数组越界的判断,如果像下面一样的写法,两个判断语句就显得代码很冗余class Solution: ...

2018-10-23 09:18:19 508

原创 Spark数据倾斜之发现篇

用spark做大数据处理,不怕数据大,就怕发生数据倾斜,一发生数据倾斜,轻则spark job要跑很久才能结束,重则OOM,把一个executor的存储空间撑爆,导致程序终止。一个spark job 是由多个stage组成的 ,stage之间具有先后关系,所以是串行执行的 ,一个stage是由多个task 组成的,每个task之间可以并行运行,一个stage的运行时间由耗时最长的那个task来决...

2018-10-20 15:34:19 1712 7

原创 【leetcode】72. Edit Distance

给定两个字符串,可以有插入、替换和删除操作,求最小的操作次数使得两个字符串相等,原题如下典型的Dp问题,DP核心是求递推方程,递推方程求出来,问题也就解决了,DP问题的递推方程都是建立在上一步的基础上的,也就是说在上一步满足条件的情况下求这一步该怎么做,以本地为例,我们用p[i-1][j-1]表示word1[0:i-1]和word2[0:j-1]通过上述三种操作达到相同状态所需要的最小步数,那么...

2018-10-19 08:54:13 240

原创 python守护线程

如果python线程是守护线程,那么以为着这个线程是“不重要”的,“不重要”意味着如果他的父进程结束了但该守护线程没有运行完,守护进程就会被强制结束。如果线程是非守护线程,那么父进程只有等到守护线程运行完毕后才能结束。在python中,线程通过threadName.setDaemon(True|False)来设置是否为守护线程代码实例:父进程中调用两个线程,但父进程会瞬间运行完,观察两个线程...

2018-10-14 17:35:16 1695

原创 【leetcode】710. Random Pick with Blacklist

题目如下给定N,和一个黑名单数组,要求每次从[0,N)中选出一个随机数,这个随机数不能存在于黑名单中思路:最终结果中随机数的个数肯定是N-len(blacklist),所以我们要一是要选择出最后的随机值,一个是要将黑名单的中的值映射到白名单中结果中的随机数的个数为N-len(blacklist),那么我们肯定先取数组[0,N]的前N-len(blacklist)个元素,但是这前N-len...

2018-10-14 09:40:17 1215

原创 【leetcode】754. Reach a Number

一道easy题,题目如下,不过是一道数学题,以后可能会用到相关的结论,所以记录下其实就是相当于[ ]1[ ]2[ ]3[ ]...[ ]n = target 让你在括号里填上±符号,使得n最小思路:如果不按照某个方向一直走,那么走到第N步的时候,走过的距离为1+2+3+..+N如果其中第j步朝着反方向走,那么走过的距离就是在原来朝着某个方向走距离的基础上减去2*j所以一直tar...

2018-10-13 14:09:44 391

原创 【leetcode】748. Shortest Completing Word

题目描述记录这道题的目的在于第二种解法比较有启发意义方法一:我的low B做法class Solution: def shortestCompletingWord(self, licensePlate, words): """ :type licensePlate: str :type words: List[str] ...

2018-10-11 08:53:22 309

原创 让IDEA仅编译运行当前程序

使用IDEA做大型项目时,有时我们会写一些简单的测试程序来检查单元的正确性,但是每次run小的代码时,IDEA总是会将整个项目编译一遍,造成不必要的时间浪费点击run ->edit configuration 将箭头处的build 修改为build no error check,并将原来的build删除即可...

2018-10-09 11:59:08 13474

原创 【leetcode】872.Leaf-Similar Trees

就是找到二叉树的所有叶子节点,很easy 的DFS自己的写法# Definition for a binary tree node.class TreeNode: def __init__(self, x): self.val = x self.left = None self.right = Noneclass Solution...

2018-10-07 18:42:28 454

原创 app2vec在广告投放中的应用

本文参考了important_MODELING USERS FOR ONLINE ADVERTISING,主要介绍word2vec的改进版本app2vec在广告投放系统中的应用。一、word2vec原理部分不再叙述,下面先回顾一下word2vec在求word embedding的过程,以CBOW为例加入我们现在有一段文本{I drink coffee everyday},一共包含五个四个单词...

2018-10-06 20:55:37 2986 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除