自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

rosefun96的博客

深度学习、算法交流q群596506387。

原创 Spark实现xgboost多分类(python)

1. spark-xgboost Java包 主要需要xgboost4j-spark-0.90.jar, xgboost4j-0.90.jar, 以及 调用代码 sparkxgb.zip. GitHub上面有xgboost java 实现的包,链接:xgboost; 但我省事,用了zhihu xg...

2020-07-02 12:56:06 8 0

原创 LeetCode718. 最长重复子数组(python)

1. 问题 给两个整数数组 A 和 B ,返回两个数组中公共的、长度最长的子数组的长度。 示例 1: 输入: A: [1,2,3,2,1] B: [3,2,1,4,7] 输出: 3 解释: 长度最长的公共子数组是 [3, 2, 1]。 说明: 1 <= len(A), len(B) <...

2020-07-01 01:14:55 41 0

原创 pandas dataframe中iloc和loc的区别

1. iloc iloc主要定位的是相对位置,如kFold这种都是这种相对索引进行split。 2. loc loc定位的是dataframe 本身的index。 示例: a = pd.DataFrame({"f1":[11,22,33,44,55]},index=[6,5,4...

2020-06-20 22:40:14 61 0

原创 pyspark sql数据类型

1. pyspark数据类型 “DataType”, “NullType”, “StringType”, “BinaryType”, “BooleanType”, “DateType”, “TimestampType”, “DecimalType”, “DoubleType”, “FloatTyp...

2020-06-17 21:17:37 65 0

原创 spark DataFrame类型(pyspark)

json读取为dataframe sc = spark.sparkContext # A JSON dataset is pointed to by path. # The path can be either a single text file or a directory storing ...

2020-06-16 15:22:01 61 0

原创 Hadoop命令汇总

1. 用户命令 hadoop集群用户的常用命令。 archive 创建一个hadoop档案文件。参考 Hadoop Archives. 用法:hadoop archive -archiveName NAME * distcp 递归地拷贝文件或目录。参考DistCp指南以获取等多信息。 ...

2020-05-28 21:44:38 76 0

原创 Hadoop初入门(4) 分布式文件系统:架构和设计

Namenode 和 Datanode HDFS采用master/slave架构。一个HDFS集群是由一个Namenode和一定数目的Datanodes组成。Namenode是一个中心服务器,负责管理文件系统的名字空间(namespace)以及客户端对文件的访问。集群中的Datanode一般是一个...

2020-05-28 21:34:22 92 0

原创 hadoop初入门(3)

1. 执行命令 将输入文件拷贝到分布式文件系统: $ bin/hadoop fs -put conf input $ bin/hadoop fs -get output output $ cat output/* 在分布式文件系统上查看输出文件: $ bin/hadoop fs -cat ou...

2020-05-28 21:20:00 64 0

原创 Leetcode680. 验证回文字符串 Ⅱ(python,递归)

1. 题目 给定一个非空字符串 s,最多删除一个字符。判断是否能成为回文字符串。 示例 1: 输入: "abca" 输出: True 解释: 你可以删除c字符。 注意: 字符串只包含从 a-z 的小写字母。字符串的最大长度是50000。 来源:力扣(LeetCode) 链接...

2020-05-19 10:47:17 73 0

原创 损失函数总结
原力计划

损失函数一般分为4种,HingeLoss 0-1 损失函数,绝对值损失函数,平方损失函数,对数损失函数。 (Hinge Loss):主要用于支持向量机(SVM) 中 Hinge loss 可以用来解 间距最大化 的问题。 J(w)=12∥w∥2+C∑imax⁡(0,1−yiwTxi)=12∥w∥...

2020-05-15 09:07:00 180 0

原创 LeetCode560. 和为K的子数组

1. 题目 给定一个整数数组和一个整数 k,你需要找到该数组中和为 k 的连续的子数组的个数。 示例 1 : 输入:nums = [1,1,1], k = 2 输出: 2 , [1,1] 与 [1,1] 为两种不同的情况。 说明 : 数组的长度为 [1, 20,000]。 数组中元素的范围是 [...

2020-05-15 08:40:51 58 0

原创 浅谈DeepWalk

1. 简介 通过随机游走获得序列,然后word2vec向量化。 算法: 在定义好图,比如,把user 和 item 进行边连接,从一个 user出发,可以获得很多个与该user相关的其他item,然后作为一个序列。最终用word2vec,比如skip-gram + 层次softmax。从而向量化...

2020-05-14 11:19:02 106 0

原创 Gensim简介及word2vec API

1. 简介 Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。 它支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法。 参考: zhihu 15分钟入门Gensim; wiki Genism; ...

2020-05-10 19:58:45 163 0

原创 字符串的全排列python实现

1. 题目 给定一个字符串,找出有该字符串所有字符排列组成的所有字符串。 2. 方法 迭代,遍历字符串,取遍历的字符当作首字符,对剩下的字符组成的字符串再次进行全排列操作。 注意:有可能出现相同字符的情况,用visited来记录首位置出现过的字符。 ### def quan_pailie(s,r...

2020-05-09 17:13:23 113 0

原创 LeetCode69. x 的平方根(python,泰勒展开)

1. 题目 实现 int sqrt(int x) 函数。 计算并返回 x 的平方根,其中 x 是非负整数。 由于返回类型是整数,结果只保留整数的部分,小数部分将被舍去。 示例 2: 输入: 8 输出: 2 说明: 8 的平方根是 2.82842..., 由于返回类型是整数,小数部分将被...

2020-05-09 08:10:19 81 0

原创 LeetCode530. 二叉搜索树的最小绝对差(python,中序遍历)

1. 题目 给你一棵所有节点为非负值的二叉搜索树,请你计算树中任意两节点的差的绝对值的最小值。 示例: 输入: 1 \ 3 / 2 输出: 1 解释: 最小绝对差为 1,其中 2 和 1 的差的绝对值为 1(或者 2 和 3)。 来源:力扣(LeetCod...

2020-05-07 20:56:04 109 0

原创 LeetCode面试题 04.04. 检查平衡性(python,递归)

1. 题目 实现一个函数,检查二叉树是否平衡。在这个问题中,平衡树的定义如下:任意一个节点,其两棵子树的高度差不超过 1。 示例 1: 给定二叉树 [3,9,20,null,null,15,7] 3 / \ 9 20 / \ 15 7 返回 true 。 来...

2020-05-07 20:14:35 131 0

原创 9种排序方法及python实现(冒泡,插入,希尔,选择,堆,快速,桶,基数,归并排序)
原力计划

1. 排序算法分类 外部排序 (External sorting)是指能够处理极大量数据的排序算法。 通常来说,外排序处理的数据不能一次装入内存,只能放在读写较慢的外存储器(通常是硬盘)上。外排序通常采用的是一种“排序-归并”的策略。 在排序阶段,先读入能放在内存中的数据量,将其排序输出到一个临...

2020-05-06 12:34:00 327 2

原创 LeetCode983. 最低票价(python,动态规划)

1. 题目 在一个火车旅行很受欢迎的国度,你提前一年计划了一些火车旅行。在接下来的一年里,你要旅行的日子将以一个名为 days 的数组给出。每一项是一个从 1 到 365 的整数。 火车票有三种不同的销售方式: 一张为期一天的通行证售价为 costs[0] 美元; 一张为期七天的通行证售价为 co...

2020-05-06 08:19:05 117 0

原创 LeetCode面试题40. 最小的k个数(python,快速排序)

1. 题目 输入整数数组 arr ,找出其中最小的 k 个数。例如,输入4、5、1、6、2、7、3、8这8个数字,则最小的4个数字是1、2、3、4。 示例 1: 输入:arr = [3,2,1], k = 2 输出:[1,2] 或者 [2,1] 限制: 0 <= k <= arr.l...

2020-05-05 20:35:24 79 0

原创 python哈希表(字典)实现
原力计划

1. 概念 哈希表(hash table),又称散列表,是根据键key直接访问内存存储位置的数据结构。关键字经过散列函数,得到键key。 给定一对(关键字,值),关键字经过散列函数转换,得到存储位置,该存储位置存储(关键字,值)。 2. 常见的散列函数 散列函数的性质: 如果两个散列值是不相同的(...

2020-05-05 16:04:09 146 0

原创 LeetCode739. 每日温度(python, 栈)

1. 题目 根据每日 气温 列表,请重新生成一个列表,对应位置的输出是需要再等待多久温度才会升高超过该日的天数。如果之后都不会升高,请在该位置用 0 来代替。 例如,给定一个列表 temperatures = [73, 74, 75, 71, 69, 72, 76, 73], 你的输出应该是 ...

2020-05-01 11:06:15 117 0

原创 CTR之FM模型及keras实现

class FM(Layer): """Factorization Machine models pairwise (order-2) feature interactions without linear term and bias. ...

2020-04-27 23:31:15 134 0

原创 LeetCode33. 搜索旋转排序数组(二分法,python)

1. 题目 假设按照升序排序的数组在预先未知的某个点上进行了旋转。 ( 例如,数组 [0,1,2,4,5,6,7] 可能变为 [4,5,6,7,0,1,2] )。 搜索一个给定的目标值,如果数组中存在这个目标值,则返回它的索引,否则返回 -1 。 你可以假设数组中不存在重复的元素。 你的算法时间复...

2020-04-27 10:02:03 48 0

原创 LeetCode23. 合并K个排序链表

1. 题目 合并 k 个排序链表,返回合并后的排序链表。请分析和描述算法的复杂度。 示例: 输入: [ 1->4->5, 1->3->4, 2->6 ] 输出: 1->1->2->3->4->4->5->6 来...

2020-04-26 10:14:26 53 0

原创 LeetCode2. 小张刷题计划

1. 题目 为了提高自己的代码能力,小张制定了 LeetCode 刷题计划,他选中了 LeetCode 题库中的 n 道题,编号从 0 到 n-1,并计划在 m 天内按照题目编号顺序刷完所有的题目(注意,小张不能用多天完成同一题)。 在小张刷题计划中,小张需要用 time[i] 的时间完成编号 i...

2020-04-25 22:03:28 153 0

原创 LeetCode874. 模拟行走机器人(python,普通遍历题)

1. 题目 机器人在一个无限大小的网格上行走,从点 (0, 0) 处开始出发,面向北方。该机器人可以接收以下三种类型的命令: -2:向左转 90 度 -1:向右转 90 度 1 <= x <= 9:向前移动 x 个单位长度 在网格上有一些格子被视为障碍物。 第 i 个障碍物位于网格点...

2020-04-23 13:10:36 98 0

转载 不平衡样本对SVM的影响

样本失衡会对SVM的影响 假设正类样本远多于负类 1、线性可分的情况 假设真实数据集如下: 由于负类样本量太少,可能会出现下面这种情况 使得分隔超平面偏向负类。严格意义上,这种样本不平衡不是因为样本数量的问题,而是因为边界点发生了变化 2、线性不可分的情况 源数据以及理想的超平面情况如下: 很可能...

2020-04-22 17:10:56 125 0

原创 LeetCode 面试题63. 股票的最大利润

1. 题目 假设把某股票的价格按照时间先后顺序存储在数组中,请问买卖该股票一次可能获得的最大利润是多少? 示例 1: 输入: [7,1,5,3,6,4] 输出: 5 解释: 在第 2 天(股票价格 = 1)的时候买入,在第 5 天(股票价格 = 6)的时候卖出,最大利润 = 6-1 = 5 。 ...

2020-04-21 18:01:48 102 0

原创 LeetCode面试题42. 连续子数组的最大和

1. 题目 输入一个整型数组,数组里有正数也有负数。数组中的一个或连续多个整数组成一个子数组。求所有子数组的和的最大值。 要求时间复杂度为O(n)。 示例1: 输入: nums = [-2,1,-3,4,-1,2,1,-5,4] 输出: 6 解释: 连续子数组 [4,-1,2,1] 的和最大,为 ...

2020-04-21 16:35:22 64 0

原创 LeetCode面试题 08.01. 三步问题(简单,动态规划,python)

1. 题目 三步问题。有个小孩正在上楼梯,楼梯有n阶台阶,小孩一次可以上1阶、2阶或3阶。实现一种方法,计算小孩有多少种上楼梯的方式。结果可能很大,你需要对结果模1000000007。 示例1: 输入:n = 3 输出:4 说明: 有四种走法 来源:力扣(LeetCode) 链接:ht...

2020-04-21 16:25:46 77 0

原创 LeetCode面试题 17.16. 按摩师(python,动态规划)

1. 题目 一个有名的按摩师会收到源源不断的预约请求,每个预约都可以选择接或不接。在每次预约服务之间要有休息时间,因此她不能接受相邻的预约。给定一个预约请求序列,替按摩师找到最优的预约集合(总预约时间最长),返回总的分钟数。 注意:本题相对原题稍作改动 示例 1: 输入: [1,2,3,1] 输出...

2020-04-21 16:08:58 70 0

原创 LeetCode375. 猜数字大小 II(python,动态规划)

1. 题目 我们正在玩一个猜数游戏,游戏规则如下: 我从 1 到 n 之间选择一个数字,你来猜我选了哪个数字。 每次你猜错了,我都会告诉你,我选的数字比你的大了或者小了。 然而,当你猜了数字 x 并且猜错了的时候,你需要支付金额为 x 的现金。直到你猜到我选的数字,你才算赢得了这个游戏。 示例: ...

2020-04-21 15:19:29 87 0

原创 常见数据结构与C++实现

1. 线性表 顺序表 #include <iostream> #include <vector> using namespace std; void print_vector(vector<auto> vec){ for (auto i:vec){ co...

2020-04-21 13:30:23 52 0

原创 常见数据结构与python实现

python重要的数据结构list 可以实现线性表,队列,栈等。 1. 线性表 顺序表 size = 10 array = [0 for i in range(size)] 链表 class ListNode: def __init__(self,x): self.val = x se...

2020-04-21 12:16:05 64 0

原创 LeetCode743. 网络延迟时间(python,bfs)

1. 题目 有 N 个网络节点,标记为 1 到 N。 给定一个列表 times,表示信号经过有向边的传递时间。 times[i] = (u, v, w),其中 u 是源节点,v 是目标节点, w 是一个信号从源节点传递到目标节点的时间。 现在,我们从某个节点 K 发出一个信号。需要多久才能使所有节...

2020-04-21 11:32:20 60 0

原创 LeetCode1248. 统计「优美子数组」

1. 题目 给你一个整数数组 nums 和一个整数 k。 如果某个 连续 子数组中恰好有 k 个奇数数字,我们就认为这个子数组是「优美子数组」。 请返回这个数组中「优美子数组」的数目。 示例 1: 输入:nums = [1,1,2,1,1], k = 3 输出:2 解释:包含 3 个奇数的子数组是...

2020-04-21 08:31:49 114 1

原创 LeetCode103. 二叉树的锯齿形层次遍历

1. 问题 给定一个二叉树,返回其节点值的锯齿形层次遍历。(即先从左往右,再从右往左进行下一层遍历,以此类推,层与层之间交替进行)。 例如: 给定二叉树 [3,9,20,null,null,15,7], 3 / \ 9 20 / \ 15 7 返回锯齿形层...

2020-04-20 23:46:51 45 0

原创 LeetCode200. 岛屿数量(python,bfs)

1. 题目 给你一个由 ‘1’(陆地)和 ‘0’(水)组成的的二维网格,请你计算网格中岛屿的数量。 岛屿总是被水包围,并且每座岛屿只能由水平方向和/或竖直方向上相邻的陆地连接形成。 此外,你可以假设该网格的四条边均被水包围。 示例 1: 输入: 11110 11010 11000 00000 输出...

2020-04-20 10:40:20 93 0

原创 LeetCode123. 买卖股票的最佳时机 III(python,动态规划)

1. 题目 给定一个数组,它的第 i 个元素是一支给定的股票在第 i 天的价格。 设计一个算法来计算你所能获取的最大利润。你最多可以完成 两笔 交易。 注意: 你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。 示例 1: 输入: [3,3,5,0,0,3,1,4] 输出: 6 解释:...

2020-04-19 19:36:03 81 0

提示
确定要删除当前文章?
取消 删除