自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Little_Fire的博客

致力于大数据分析、机器学习与推荐系统学习与研究的技术小白,但我相信不积跬步无以至千里,不积小流无以成江海

  • 博客(16)
  • 资源 (1)
  • 收藏
  • 关注

原创 面试算法combine sum专题讲解二(动态规划法)

这一部分,我们将讲解DP问题求解combine sum的最优解问题。涉及的代码题目是leetcode 377、322leetcode 377问题描述:整数数组,无重复元素,但每个数字可以被重复使用,给出组合的总数,无须给出所有排列。算法设计思路:创建dp数组,dp[i]表示target为i时,无重复元素组合的总数。算法实现:class Solution(object): def combi...

2018-05-30 09:52:26 503

原创 面试算法combine sum专题讲解一(回溯法)

combine sum是面试算法中最常考的一类题型,其主要思想是应用背包问题的延伸。主要描述为:在一组数字中,寻找子数组,使子数组的元素和为target的所有组合,求罗列所有组合,或求解组合总数,或求解最少使用的组合中元素个数(找零钱问题leetcode322)这里我们就几道经典leetcode题目来做一下综述和讲解。本节的三个题目39、40、216都是回溯法解题。关于回溯法的介绍,可以查看以下博...

2018-05-30 08:59:03 807

转载 机器学习中特征选择的方法综述

本文摘自知乎用户文章的第三章节,源出处地址:作者:城东链接:https://www.zhihu.com/question/28641663/answer/110165221来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。当数据预处理完成后,我们需要从所有特征中选择有意义的特征,并将其输入机器学习算法和模型进行训练。通常来说,从以下两个方面考虑来选择特征:(1)特征是否...

2018-05-29 20:25:22 1676

原创 什么是lambda函数?使用lambda函数有什么好处?

(一)什么是lambda函数:Python支持一种有趣的语法,它允许你快速定义单行的最小函数。这些叫做lambda的函数是从Lisp中借用来的,可以被用在任何需要函数的地方。lambda 函数是一个可以接收任意多个参数(包括可选参数)并且返回单个表达式值的匿名函数。 (注意:lambda 函数不能包含命令,它们所包含的表达式也不能超过一个)(二)使用lambda函数的好处:1、lambda函数比较...

2018-05-29 18:15:09 20428

转载 (转载)特征工程概述与理解

https://blog.csdn.net/NXHYD/article/details/76787801目录1 特征工程是什么?2 数据预处理  2.1 无量纲化    2.1.1 标准化    2.1.2 区间缩放法    2.1.3 标准化与归一化的区别  2.2 对定量特征二值化  2.3 对定性特征哑编码  2.4 缺失值计算  2.5 数据变换3 特征选择  3.1 Filter    ...

2018-05-29 17:36:46 324

原创 python中lambda函数的理解与使用

Lambda函数,即Lambda 表达式(lambda expression),是一个匿名函数(不存在函数名的函数),Lambda表达式基于数学中的λ演算得名,直接对应于其中的lambda抽象(lambda abstraction)。入门Python的朋友会问,函数没有名字也可以吗?当然可以。有些函数如果只是临时一用,而且它的业务逻辑也很简单(比如做个简单加法、取绝对值、简单过滤等)时,就没必要非...

2018-05-29 17:32:07 38097 2

转载 机器学习中高维数据降维技术的总结与研究

本文有比较多的转载其他研究人员的博客https://blog.csdn.net/u014772862/article/details/52335970作为一名机器学习的科研人员,之前在推荐系统的开发和工作中,学习了PCA(主成分分析)与SVD(奇异值分解)方面的技术,但是还没有写过总结性的文章,此次,本人总结一些关于降维技术的调研,希望大家多多指教。降维方法一般分为线性降维方法和非线性降维方法,如...

2018-05-29 15:09:23 10786 1

原创 LDA(Dirichlet Distribution)主题模型基本知识与理解(二)

在第一部分博客里已经讲解了LDA的一些基本组成,这篇博文将会讲解LDA在NLP方面的应用。望大家继续支持上一篇博文:https://blog.csdn.net/Little_Fire/article/details/80483566(三)Dirichlet分布在NLP中的应用(关于topic生成word的过程)根据上文中提到了的掷硬币的例子,假设自然语言中存在很多奇怪的coin(religion、...

2018-05-28 22:31:51 765

原创 LDA(Dirichlet Distribution)主题模型基本知识与理解(一)

 最近在研究无监督模型与降维技术,说起无监督模型,我们首先想到的是聚类技术(Clustering),而在实际生产中,很多方法可以被用来做降维(正则化Lasso/Ridge回归、PCA主成分分析、小波分析、线性判别法、拉普拉斯特征映射等),其中基于主成分分析(PCA)的Topic Model技术包含了pLSA、LDA、SVD分解等。+本文为大家科普一下,作为一名机器学习相关工作者,本人对LDA的基本...

2018-05-28 20:50:19 4366

原创 Eclipse中的maven项目打成jar包

实际生产中,我们经常要将maven项目打包成jar,然后直接放入hadoop集群环境中运行。之前对于maven项目的使用走了很多弯路,调试了好久,终于调试通过了。以下将为大家分享一下经验。本文讲解的是打成jar包,不是war包。首先在pom.xml中添加如下代码(添加插件,使得dependencies与项目源码打成一个jar):<build> <plugins> ...

2018-05-28 10:14:09 17263 2

原创 Eclipse中 XXX cannot be resolved to a type的解决方案

在eclipse的使用过程中,经常会遇到XXX cannot be resolved to a type的问题,其字面意义是无法识别的类型,也就是说你的代码中有可能存在以下几种情况:(1)未导入的包;(2)写错的Class Name;(3)未创建却被使用的变量。因为现在的开源化开发环境,很多情况都是使用maven集成开发,或者jar包的导入方面存在缺少对应和jar包和jar包版本冲突等问题,故容易...

2018-05-25 15:16:42 7808

原创 eclipse maven项目,如何导出使用的依赖jar包

(1)在eclipse中定位到maven项目的pom.xml文件;(2)右击pom.xml文件,选择Run As  >> Maven build…(3)在下图的Goals框中输入“dependency:copy-dependencies”,后点击“Run”即可。当控制台出现“BUILD SUCCESS”时,表示build成功。在当前项目的根目录“targed/dependency”下可...

2018-05-25 11:22:56 3275

原创 特征值分解与奇异值分解原理与计算

(一)特征值如果一个非零向量v是方阵A的特征向量,将一定可以表示成下面形式,而λ是特征向量v对应的特征值:特征值分解是将一个矩阵分解成下面的形式:其中Q是这个矩阵A的特征向量组成的矩阵,Σ是一个对角阵,每一个对角线上的元素就是一个特征值。一个矩阵的一组特征向量是一组正交向量。【练习题】求解矩阵A的特征值与特征向量。方阵的特征值表示什么含义呢,我们通过一组向量图表示。初始状态下,i(红色)和j(蓝色...

2018-05-25 01:36:39 7931 1

原创 协方差与样本相关性

方差(Variance):用来度量随机变量和其数学期望(均值)之间的偏离程度。样本方差(Sample Variance):每个样本值与全体样本值的平均数之差的平方值的平均数协方差(Covariance):表示两个变量X、Y的总体误差。如果X、Y的变化趋势一致,cov(X,Y)>0,两个变量正相关;若X、Y的变化趋势相反,cov(X,Y)<0,两者负相关;若cov(X,Y)=0,X与Y线...

2018-05-25 01:02:21 2725

转载 转载:奇异值分解(SVD)详解及其应用

最近一直在研究关于奇异值分解与推荐系统隐语义模型方面的内容,看到了一篇讲述很详细的文章,觉得蛮实用的,给大家分享一下。原文链接:https://blog.csdn.net/shenziheng1/article/details/529162781.前言PCA的实现一般有两种,一种是用特征值分解(eigenvalue decomposition)去实现的,一种是用奇异值分解(SVD)去实现的。特征值...

2018-05-24 22:32:06 312

原创 动态规划与0-1背包问题解析

动态规划,作为程序员面试过程中几乎是必考的题目类型,在实际生产应用中也广泛使用。0-1背包问题作为最经典的算法之一,也衍生了很多其他的题目(如找零钱、爬楼梯等leetcode题目)。本人在复习之余,将总结下来的算法常识得以分享:(一)什么是动态规划作为运筹学的一个分支,动态规划(DP)最早是用于求解决策过程最优化的问题被提出,利用各阶段dp变量之间的关系,逐个求解,最终求得全局最优解的过程。再设计...

2018-05-24 21:05:43 3746

虚拟页式存储管理系统

虚拟页式存储管理系统,支持先进先出算法、最佳值换算法和LRU算法。

2010-12-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除