自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(96)
  • 收藏
  • 关注

原创 matlab实现FCM算法

% author:wangjunzuo% date:2019/5/21% fuction:fcm algrithmnload data load labelmaxgen = 100; %??????m = 2; %2??threshold = 10e-1000; %?????cluster_n = 3; %????%%%%%%%%%...

2019-05-23 21:15:04 4251 7

原创 2018网易球队编程题

2019-04-18 22:14:51 353

原创 YARN配置

2019-04-18 10:54:54 286

原创 线性降维和PCA

2019-04-17 15:03:45 551

原创 大整数相乘

问题描述有两个用字符串表示的非常大的大整数,算出他们的乘积,也是用字符串表示。不能用系统自带的大整数类型。解决思路先进行相乘,然后进行存储,最后考虑进位。#include<iostream>#include<string>#define MAX 1000using namespace std;int main(){ string s...

2019-04-11 19:37:37 267

原创 Given n points on a 2D plane, find the maximum number of points that lie on the same straight line.

Given n points on a 2D plane, find the maximum number of points that lie on the samestraight line.

2019-04-10 12:09:52 223

原创 2018拼多多笔试最大乘积问题(与网易合唱团动态规划相似)

给定一个无序数组,包含正数、负数和0,要求从中找出3个数的乘积,使得乘积最大,要求时间复杂度:O(n),空间复杂度:O(1)动态规划算法#include<iostream>#include<vector>using namespace std;#define MAX 10000inline long long max(long long a,long lo...

2019-04-09 22:07:30 269

原创 git简单实用总结

本文介绍了git的安装、配置、基本命令、分支和参与开源项目的操作,文中绝大部分为命令行,该笔记是用于复习而非普及知识,所以未添加详细的图片,所以仅供大家快速查找复习使用。

2019-04-09 12:02:35 150

原创 latex 常见论文操作总结(second edition)

本次版本在第一版的基础上增加了一些复杂命令,整片内容包括latex 中文支持、文章结构、图标、公式、引用、算法、转置等操作命令,匆匆完成本篇文章的编写,如有不足之处多多谅解。从本学期起每篇文章都是现在latex上编写后转换为图片,这样方便我进行复习和备份,同时也方便观看者打印。

2019-04-03 15:37:03 442

原创 公式求解

问题:”Evaluate the value of an arithmetic expression in Reverse Polish Notation.Valid operators are+,-,*,/. Each operand may be an integer or another expression.Some examples:举例:[“2”, “1”, “+”, “3”,...

2019-03-29 19:21:39 471

原创 非递归求而二叉树最短路径深度

2019-03-28 21:00:59 264

原创 动态规划 &&网易合唱团笔试

问题描述:有 n 个学生站成一排,每个学生有一个能力值,牛牛想从这 n 个学生中按照顺序选取 k 名学生,要求相邻两个学生的位置编号的差不超过 d,使得这 k 个学生的能力值的乘积最大,你能返回最大的乘积吗?...

2019-03-28 16:44:23 203

原创 动态规划

简要总结了动态规划的特点及解题步骤,本文中算法是从顶到底进行的,各位可以试着写出从底部到顶部的状态转移公式并写出代码加深理解。

2019-03-24 20:21:04 214

原创 统计学习方法总结

简要介绍了感知机、K近邻法、朴素贝叶斯法、决策树、逻辑斯蒂回归与最大熵模型、支持向量机、提升方法、EM算法、隐马尔可夫模型9种统计学习方法的特点。...

2019-03-22 21:38:52 275

原创 隐马尔可夫模型

2019-03-21 19:46:49 294

原创 EM算法

2019-03-20 12:59:15 249

原创 AdaBoost&提升树

2019-03-19 15:05:10 368

原创 支持向量机

2019-03-14 19:39:12 323

原创 拉格朗日对偶性

2019-03-13 12:42:36 311

原创 无约束最优化问题求解方法

2019-03-09 16:16:49 3953

原创 逻辑斯蒂回归与最大熵模型

2019-03-08 16:14:22 355

原创 linux学习笔记

文件内容包含Linux常用功能和命令,共快速查找。

2019-03-05 15:22:03 925

原创 python笔记

python内容比较简单所以我使用了latex软件进行了简单总结,内容包含python语法、列表元祖字典字符串、正则表达式、文件操作、调试、网络爬虫、自动化等方面的总结,特意将pdf转为了图片方便下载打印。...

2019-03-05 11:07:43 938

原创 朴素贝叶斯

2019-03-01 13:38:17 1975

原创 K近邻模型

k近邻假设给给定一个训练数据集,数据集类别已确定,对于新的实例,根据其k个最近邻训练实例的类别,通过多数表决策等方式进行预测。

2019-02-28 12:36:29 2331

原创 感知机

2019-02-25 20:34:24 1961

原创 python速成1

快速掌握python的使用,总结文档使用latex编写后转为图片,方便下载打印。后续将继续完善。

2019-02-25 17:53:00 2007

原创 latex论文写作简单入门

2019-02-23 17:25:48 2293

原创 matlab:熵值法确定权重

前言课题的模型需要给数据的各个属性进行分配权重,原本想使用AHP层次分析法求每个属性的权重,但因为这个算法主观因素偏重,而且我有用大量的数据,完全可以从数据中学习,最终选择了信息熵确定权重的方法。信息熵为什么能确定权值?信息熵是对信息不确定的一种度量,不确定性越大,信息熵越大,不确定性越小,信息熵越小,因此可以用熵值来确定一个指标的离散程度,离散程度越大,对综合评价的影响越大,其熵值...

2018-12-17 15:55:28 18404 8

原创 简单实现k-means算法

前言最近老师布置的作业中含有Borderline-SMOTE算法,而k-means算法是其基础,我需要将论文中的模型改造为自己的模型,从论文中的伪代码写出自己的框架,下面是自己动手热身实现的第一版k-means算法,很简单,如有错误请多多指教。k-means算法该算法很简单,开始时随机选取k个核心,利用欧式距离不断将数据集的样本进行分类,直至核心不在变化或者收敛为止。本篇博客重点在于...

2018-12-04 10:02:06 2461

原创 Spark分布式集群环境搭建

前提Spark分布式集群的安装环境,需要事先配置好Hadoop的分布式集群环境,hadoop分布式集群环境搭建请看hadoop分布式集群环境配置https://blog.csdn.net/Leader_wang/article/details/84449235安装spark第一步:下载spark:http://spark.apache.org/downloads.html下载完成后,运行以...

2018-11-25 14:26:41 2983 1

原创 hadoop分布式集群环境搭建

spark环境集群搭建硬件准备集群最低需要两台主机,一台作为master,一台作为worker,但由于方面限制,有时只有一台主机,这时我们可以创建一台虚拟机模拟集群环境,现在以centos系统作为演示:第一步:临时关闭SELinux第二步:使用系统自带box安装系统,安装过程省略。进入系统会乱码,重起系统可恢复,暂不支持中文显示。第三步:设置桥接模式,使主机和虚拟机能相互ping通...

2018-11-24 20:19:03 3032

原创 centos的box创建失败解决办法

使用centos的box创建虚拟机时,会触发SELinux警报,导致虚拟机创建失败,解决办法临时关闭SELinux,安装完在开启。setenforce 0 //临时关闭SELinuxsetenforce 1 //设置SELinux 成为enforcing模式...

2018-11-23 18:28:07 1613

原创 编译器构造:词法分析器代码详细讲解

词法分析的功能词法分析是编译器处理流程中的第一步,它顺序扫描文件内的字符,通过硬编码方式解析器进行匹配,产生各式各样的词法记号。扫描器扫描器读取源文件年,按序返回文件内的字符,直到文件结束。为了节省IO开销,解释用缓冲区结构。#define BUFFEN 100 //缓冲区大小int len_data = 0; //缓冲区数据长度int readIndex = -...

2018-11-23 16:19:21 3079

原创 ID3决策树代码详解(weka平台)

1 ID3算法流程理论知识不必多讲,下面讲解ID3算法的工作流程,以西瓜书为例: 2 算法代码讲解 2.1 前提必知 2.2 算法流程 3:代码整个算法实际就 makeTree和distributionForInstance两个函数,下面把代码附上来,想要执行的话请下在weka平台,里面包含依赖的类。package weka.classifiers.trees;/...

2018-11-09 13:30:56 3464 2

原创 淘宝双11数据分析与预测课程案例:实验环境搭配

1 软件安装清单安装Hadoop安装MySQL安装Hive安装Sqoop安装Eclipse安装ECharts 2 hadoop安装hadoop在centos的伪分布式安装3 MySql安装

2018-11-08 19:44:08 4493 9

原创 RDD编程

1 RDD创建RDD创建有两种形式,1:从外部读取数据源,外部可指本地系统、HDFS系统等;2:调用SparkContext的parallelize方法,在Driver中一个已经存在的集合(数组)上创建。1.1 演示前提启动hadoop和spark-shell&gt;&gt;start-dfs.sh //启动hadoop&gt;&gt;sprak-shell //启动spark&...

2018-11-06 21:20:55 1807

原创 spark运行构架

Spark运行框架由集群资源管理器(Cluster Manager)、每个任务的任务控制节点(Driver)、运行作业任务的工作节点(Worker Node)、每个工作节点上负责具体任务的执行进程(Executor)。Spark所采用的Executor有两个优点:一是利用多线程来执行具体的任务(Hadoop MapReduce采用的是进程模型),减少任务的启动开销;二是Executor中有一个...

2018-11-06 13:13:55 1299

原创 Scala数据结构

数组val arr = new Array[int](2)arr(0) = 1arr(1) =2#上面的代码等价于val arr = Array(1,2)列表val intList = List(1,2,3)#列表由头部和尾部之分,上面的头部为1,尾部为List(2,3);因此可以将元素插入到头部;0::intList #此刻的intList列表为List(0,1...

2018-11-05 18:11:56 1343

原创 Scala基础

val和varval变量在声明时必须进行初始化,初始化后不能进行再赋值;var声明时进行赋值,初始化后还可以在进行赋值;基本数据类型和操作Scala的数据类型包括:Byte、Char、Short、Int、Long、Float、Double和Boolean。加(+)、减(-) 、乘(*) 、除(/) 、余数(%)和关系和逻辑操作操作符。RangeRange用于代替for循环1 t...

2018-11-05 10:58:04 1259

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除