自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

fengkuang的一亩三分地

Mastery is not a commitment to a goal, but to a constant pursuit.

  • 博客(11)
  • 收藏
  • 关注

原创 word2vec原理与实现

定义word2vec是一种把词转到某种向量空间的方法,在新的向量空间,词之间的相互关系,上下文关系都以某种程度被表征出来。方法词向量的转换方法有两种: CBOW(Continouns bags of words)和Skip-gram。 以下图示为CBOW的网络结构图 上图中的x1,x2,….Xc代表的是源码中的context向量中的每个单词,这个上下文的窗口大小对每个词都是随...

2018-08-28 15:03:42 2363

原创 455. Assign cookies

问题描述作为父母,你需要给你的孩子们分饼干,这些饼干有不同的大小,每个孩子都有一个让他们能满意的饼干尺寸大小,求最多能让几个孩子满意呢?举例解决方案class Solution(object): def findContentChildren(self, g, s): """ :type g: List[int] :t...

2018-08-24 00:19:57 186

原创 63. Unique Path II

问题描述机器人走方格,只能朝右或者下走,一次只能走一个格子。有些格子有障碍无法通过,他们的值用1表示,有些是空,用0表示可以通过。试求共有多少条不同路径可以走出去(到finish那个方格)。 解决方案Python版动态规划:class Solution(object): def uniquePathsWithObstacles(self, obstacleGrid):...

2018-08-23 00:07:25 165

原创 深入理解spark LR实现源码

LR模型简介LR是LogisticRegression的简称,译为逻辑回归。它本质上等价于一个线性模型。使用方法import org.apache.spark.mllib.classification.{LogisticRegressionModel, LogisticRegressionWithLBFGS}import org.apache.spark.mllib.eval...

2018-08-22 12:01:12 2251 1

原创 编程:把二元查找树转成排序的双向链表

二元查找树的特点是,左孩子值 < 节点当前值 < 有孩子值。该转换要求不开辟新的节点,只是实现指针的变换。解决此题有两种思路: 1. 递归:很多有关树的题都可以用递归来解决。首先,要缕清思路。对于当前节点,首先把左子树转换成双向链表,同时返回左子树链表的最大值,也就是最后一个节点;创立最后一个节点和当前节点的双向指针关系;然后把右子树转换成双向链表,返回子链表的最小值,也就是最左边的...

2018-08-18 12:32:59 345

原创 300. Longest Increasing Subsequence最长递增子序列LIS

问题描述给出一个没有排序的整数数组,找出最长递增子序列的长度。解决方案DP动态规划方法 python版实现,复杂度O(n^2)。状态数组d[i]表示数组前i个数的最大递增子序列长度。转移公式为: max(d[j]+1, d[i])class Solution(object): def lengthOfLIS(self, nums): """ ...

2018-08-14 15:16:41 146

原创 87. Scramble String打乱字符串

题目描述给出一个字符串,建立一个二叉树用于存储它,除了叶子节点,其他节点的左右孩子都是非空子树。如下图 我们采用以下方法打乱此树:从这棵树中选择一个非叶子节点,例如gr节点,我们交换它的左右子树得到新节点”rg”。向上合并得到新的字符串: 我们说”rgeat”是”great”的乱序字符串。 问题: 给定两个同等长度字符串s1和s2,判断s2是不是s1的乱序字符串。 解决方案...

2018-08-13 14:43:50 566

原创 94. Binary Tree Inorder Traversal

问题二叉树的中序遍历。思路递归,注意递归的顺序就好了。左节点->父节点->右节点。二叉树的三序遍历,包含前序、中序、后序遍历,这里的顺序指的对象都是父节点。答案1. 递归版c++版,耗时0ms:/** * Definition for a binary tree node. * struct TreeNode { * int v...

2018-08-13 00:01:01 166

原创 深入理解Spark ALS--源码解读与接口优化

源码见ALS.scala和MatrixFactorizationModel.scala调用方法import org.apache.spark.mllib.recommendation.{ALS, Rating}import org.apache.spark.sql.{Row, SparkSession}import org.apache.spark.storage.StorageL...

2018-08-07 21:03:07 1297

原创 spark LDA源码解读

1.源码组成spark LDA模型的调用接口放在了ml库中,org/apache/spark/ml/clustering/LDA.scala。 spark实现的LDA模型在apache/spark/tree/branch-2.1/mllib/src/main/scala/org/apache/spark/mllib/clustering路径中。以下是其源码组成: 2.训练使用我们先...

2018-08-03 21:40:03 721

原创 LDA主题模型-Familia源码解读

1. 定义:关于LDA有两种含义,一种是线性判别分析(Linear Discriminant Analysis),一种是概率主题模型:隐含狄利克雷分布(Latent Dirichlet Allocation,简称LDA),2003年提出,我们这里讲的是后者。 知乎上有篇帖子关于LDA解释的非常详细:一文详解LDA主题模型2. LDA的训练过程1. 数据预处理:分词2. 训练:...

2018-08-01 18:42:15 4133

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除