自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 Decision Tree——ID3、C4.5、CART

决策树关键问题:如何选择特征进行分支 ID3算法思想:选择信息增益最大的属性作为当前的特征对数据集进行分类。 信息熵:信息的不确定性程度,变量的不确定性越大,熵的值越大;随机变量不确定性的度量叫熵。一个变量X,它可能的取值有n多种,分别是x1,x2,……,xn,每一种取到的概率分别是P1,P2...

2018-05-31 16:30:20 251 0

原创 笔试编程题输入输出模板备忘

C语言: 借用C中的malloc/free #include "stdafx.h" #include "stdlib.h" int main() { ...

2018-03-29 22:53:33 1472 0

原创 机器学习面试问题笔记

1, xgboost与GBDT区别(算法到内存)? XGBoost原理: https://blog.csdn.net/a819825294/article/details/51206410 http://www.52cs.org/?p=429 xgboost导读和实战.pdf https...

2018-03-20 16:08:37 416 2

原创 SVM支持向量机算法笔记

支持向量机 支持向量机可用来做什么? 分类、回归(例如时间序列预测)、边界检测、聚类 什么是支持向量机? SVM是一种可用于解决分类和回归问题的有监督机器学习算法,但更常用于分类。假设有两类或两类以上的数据,SVM可以作为一个区分性的分类器,它通常由一个可把所有数据都分开的最优...

2018-03-19 01:01:00 248 0

原创 Logistic Regression算法笔记

机器学习中的逻辑回归Logistic Regression Logistic Function 逻辑回归(Logistic Regression)的名称是由其使用的核心函数–Logistic function得来的。 Logistic函数也叫作Sigmoid函数,最初由统计学家发明用来描...

2018-03-07 17:27:29 195 0

原创 AUC

AUC: Area Under Curve, 默认为ROC(receiver operating characteristic curve) Curve, 也可以指定PR(Precision Recall) curve。 由于ROC曲线的X轴为False Positive Rate,Y轴为Tru...

2020-06-16 19:45:50 57 0

原创 DeePray:深度学习推荐算法新基建
原力计划

开源项目 DeePray 发布啦!针对推荐算法,特别是点击率预估领域目不暇接的诞生新模型现状,如何将心仪模型快速应用于领域内一直是一项棘手的问题,DeePray这个项目通过统一构建数据流水线,提供各类网络层组件,在此之上,以模块化设计,用组件之砖,搭建各类网络之模型,并以灵活配置式的方式提供调用接...

2020-06-05 21:32:05 137 0

原创 Spark伪分布式环境配置与Scala、Java、Python编程实例
原力计划

本文通过收集Spark中的基本概念、在Mac上配置伪分布式环境并分别用Python、Scala、Java三种语言独立编程实现了分布式版的WordCount程序以进行测试学习,来熟悉Spark的常用操作。 本文原发布于:https://fuhailin.github.io/Spark-Tutori...

2020-03-09 01:00:52 419 0

原创 在Mac上配置HBase伪分布式娱乐环境
原力计划

HBase是运行在Hadoop分布式文件系统HDFS上进行数据存储的开源非关系型分布式数据库,2020年我尝试在Mac上配置一个伪分布式的v2.2.3 HBase环境,看看能不能进行一些基本的读写操作,以便熟悉一下分布式数据库有什么特点。 三种运行模式 单机模式 Hbase不使用HDFS,仅...

2020-03-04 22:25:17 145 0

原创 在Mac上配置Hadoop伪分布式娱乐环境
原力计划

去年我曾发文记录如何在Ubuntu上配置伪分布式版的Hadoop3娱乐环境:https://fuhailin.github.io/Hadoop-Install/ ,通过配置Hadoop娱乐环境你可以熟悉Hadoop的一些基本概念与操作方式,后来我的Dell被我玩坏了,也就没法在Ubuntu上顺畅娱...

2020-02-29 00:34:09 153 0

原创 整理Sigmoid~Dice常见激活函数,从原理到实现

本文首发于我的个人博客: 激活函数:https://fuhailin.github.io/activation-functions/ 并同步于我的公众号:赵大寳Note(ID:StateOfTheArt),回复关键词【激活函数】下载全部代码。 激活函数之性质 1. 非线性:即导数不是常数。保证多...

2020-02-21 10:39:03 579 0

原创 智能投顾

招行聪明定投怎么做的? 均线偏离法:以均线为基准线,当指数低于均线时加大定投额;当指数高于均线时减少定投额。实现在低点时多买,高点时少买,充分利用市场行情的变化,从而摊薄建仓成本,获取更高收益。 https://zhuanlan.zhihu.com/p/52827083 智能节流器:财富号为基金公...

2019-07-24 18:01:14 109 0

转载 IPFS

IPFS——它能取代HTTP协议? 现有的web协议——HTTP协议实际上已经存在很多问题。我这里引用官网https://ipfs.io/的介绍: HTTP效率低下,服务器成本昂贵 使用HTTP协议从一台计算机服务器上一次只能下载一个文件,而不是同时从多台计算机中获取文件。通过P2P方式的视频传...

2019-07-23 15:46:08 344 0

转载 tensorflow:input pipeline性能指南

以tf.data优化训练数据 Google开发者大会2018 tensorflow:input pipeline性能指南

2019-06-10 19:08:46 221 0

原创 【Leetcode】K sum problem

1. Two Sum BruteForce 首先我们可以想到一个暴力破解的方法,每两个数字之间求和看是不是目标值,时间复杂度为O(n2)O(n^2)O(n2) vector<int> twoSum_BruteForce(vector<int> &nums, int ...

2019-06-08 15:42:05 91 0

原创 MinGW

MinGWMinGW(Minamalist GNU For Windows)MinGW安装 MinGW(Minamalist GNU For Windows) MinGW(Minamalist GNU For Windows)是个精简的C/C++编译器,它实际上是将经典的开源C语言编译器GCC移植...

2019-06-08 14:07:11 2251 0

转载 c++类实例化的两种方式:new与不new的区别

new创建类对象与不new区别 A a; A * a = new a(); 以上两种方式皆可实现类的实例化,有new的区别在于: 前者在堆栈中分配内存,后者为动态内存分配,在一般应用中是没有什么区别的,但动态内存分配会使对象的可控性增强。 不加new在堆栈中分配内存 大程序用new,小程序直...

2018-10-22 20:38:47 2521 0

原创 tensorflow中常用的计算操作

1、tf.reduce_sum 从tensor的维度上面计算元素之和 tf.reduce_sum( input_tensor, # 输入 axis=None, # 表示在哪个维度进行sum操作。 keepdims=None, # 表示是否保留原始数据的维度,False相...

2018-10-22 19:09:45 307 0

原创 【剑指Offer】24. 二叉搜索树的后序遍历

题目描述: 输入一个整数数组,判断该数组是不是某二叉搜索树的后序遍历的结果。如果是则输出Yes,否则输出No。假设输入的数组的任意两个数字都互不相同。 思路: 1、序列的的最后一个数字是根节点 2、二叉搜索树左子树的节点都比根节点小,右子树的节点都比根节点大。 C++递归与非递归实现代码: #i...

2018-10-20 23:05:15 81 0

原创 gpustat : Linux下面监控GPU状态

nvidia-smi是 Nvidia 显卡命令行管理套件,基于 NVML 库,旨在管理和监控 Nvidia GPU 设备。 nvidia-smi 的输出 这是 nvidia-smi 命令的输出,其中最重要的两个指标: 显存占用 GPU 利用率 显存占用和 GPU 利用率是两个不一样的东西,显卡是...

2018-10-17 15:41:18 7228 0

原创 Tensorboard 6006端口无法访问的问题

1 、写一个简单实例,完成tensorboard 日志输出功能,示例代码如下: import tensorflow as tf input1 = tf.constant([1.0, 2.0, 3.0], name='input1') input2 = tf.Variable...

2018-10-16 14:24:56 5222 7

原创 python正则表达式从字符串中提取数字

python从字符串中提取数字 使用正则表达式,用法如下: ## 总结 ## ^ 匹配字符串的开始。 ## $ 匹配字符串的结尾。 ## \b 匹配一个单词的边界。 ## \d 匹配任意数字。 ## \D 匹配任意非数字字符。 ## x? 匹配一个可选的 x 字符 (换言之,它匹配 1 次或者 0...

2018-10-15 17:42:39 49792 1

原创 计算广告学

计算广告学目标:将流量转化为利润,尽可能使推荐的广告被用户点击。 专业术语: CTR:Click-Through-Rate,点击通过率。把一个广告所有曝光出来的次数作为总次数,把用户点击并查看广告的次数占总次数的比例叫点击率。 CTR=Click times / Show times 点击率是条件...

2018-10-08 15:53:18 361 0

原创 笔试笔记

1、一个盒子中装有黑白两色球,其中3只红球,2只黑球,如果不放回的依次取两次球,第二次取到红球的概率? 解:解:解:当第一次取到红球时,第二次取到红球的概率 P=35⋅24=310P=\frac{3}{5}\cdot \frac{2}{4}=\frac{3}{10}P=53​⋅42​=103​ 当...

2018-09-22 00:19:53 143 0

原创 C++中的平方、开方、绝对值怎么计算

#include &amp;lt;math.h&amp;gt; //平方 pow() int a = pow(4,2);// 4的平方=16 //开方 int b = pow(4,0.5);// 4的平方根=2 int c = sqrt(4);// 4的平方根=2

2018-09-11 21:47:53 67103 0

原创 顺时针打印矩阵

题目描述 输入一个矩阵,按照从外向里以顺时针的顺序依次打印出每一个数字。 例如,如果输入如下矩阵: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 则依次打印出数字1,2,3,4,8,12,16,15,14,13,9,5,6,7,...

2018-09-11 17:10:50 75 0

原创 相似字符串

今天遇到了一个算法题目:相似字符串。题目提出了一个相似字符串的定义:形如“aba”与“xyx”相似;“abc”与“xyz”相似,要求找出输入的两个字符串中相似字符串的个数。 首先我感觉这个有点类似于正则表达式,但需要根据给定的规则匹配出所有的字符串,又有点像KMP算法的过程。 这里给出一...

2018-09-10 00:44:13 269 0

原创 编程算法面试问题笔记

代码:数组中第k大的数 代码:找出一个旋转数组中的最小值 一个链表,奇数位升序,偶数位降序,将其转化成完全升序的链表 代码:O(1)空间复杂度判断一个整数是不是回文数 代码:给定一个dictionary,以及一个长字符串,判断字符串能不能拆成dict中单词的组合 ...

2018-09-09 16:06:22 100 0

原创 Bayesian(MAP)与Maximum Likelihood(MLE)的区别

首先我们得清楚MAP与MLE的概念是什么? MAP:maximun a posteriori 最大后验估计 假设θθ\theta是能够最好解释数据集DDD概率分布的参数。我们希望利用贝叶斯原理来估计参数θθ\theta: p(θ|D)=p(D|θ)∗p(θ)p(D)p(θ|D)=p(D|...

2018-09-09 15:57:14 431 0

转载 cpp中初始化vector的5种方式

Initializing like arrays : vector&lt;int&gt; vect{ 10, 20, 30 }; Specifying size and initializing all values : int n = 3; // Create a v...

2018-09-04 13:22:47 1316 0

转载 CTR点击率预估

CTR 预估本质是一个二分类问题,建模预测用户是否会点击该广告。 深度长文 | 从FM推演各深度CTR预估模型(附开源代码)

2018-08-15 21:44:19 646 0

转载 Python 头部 #!/usr/bin/python 和 #!/usr/bin/env 有区别吗?

如果你用 python xxoo.py 来运行,那么写不写都没关系,如果要用 ./xxoo.py 那么就必须加这行,这行被称为 shebang, 用来为脚本语言指定解释器. 通常认为用 #!/usr/bin/env python 要比 #!/usr/bin/python 更好,因为 python...

2018-08-08 21:30:16 213 0

原创 将Python程序模块化执行python -m

Python 头部 #!/usr/bin/python 和 #!/usr/bin/env 有区别吗? 在Python文件中指定Python解释器 https://blog.csdn.net/u011008379/article/details/79319093 References: ht...

2018-08-08 20:34:57 630 0

原创 Linux下的自动执行 命令行工具 Crontab踩坑记

http://www.adminschoice.com/crontab-quick-reference

2018-08-07 20:03:30 115 0

原创 配置ssh免密码登录

配置ssh免密码登录 https://blog.csdn.net/yanzhibo/article/details/75804619 https://blog.csdn.net/superbfly/article/details/66970114 https://stackoverflow....

2018-08-03 00:27:19 1043 0

原创 SSH连接Ubuntu服务器无法显示中文

我本地安装使用的是Ubuntu 英文环境,通过SSH连接Ubuntu服务器后无法正确显示中文 这是因为SSH连接建立过程中会把本地的语言环境发送给远程,再将返回得到的字符根据本地的语言环境进行编码解析,所以这里我需要对本地的语言环境指定为中文再连接SSH 先看一下本地的语言设置:echo %L...

2018-07-29 15:01:59 1616 0

原创 利用SSH端口转发登陆远程内网服务器

首先一定需要一台固定IP的服务器做转发代理,而且保证我们需要连接的目标主机能够通过SSH连接这台主机 主要使用命令如下: 在目标主机上执行如下命令: ssh -fCNR B_port:localhost:22 B_username@B_IP 其中B_username表示代理服务器的用户...

2018-07-29 12:38:16 2234 0

原创 g++ error: ‘printf’ was not declared in this scope

由于“printf”是C语言的打印方法,所以在g++编译器下需要引用头文件#include &lt;stdio.h&gt; 或者将printf换成c++中cout打印方法 同理: error: ‘nullptr’ was not declared in this sco...

2018-07-26 00:31:36 16682 1

原创 FM因子分解机学习笔记

References: https://www.csie.ntu.edu.tw/~b97053/paper/Rendle2010FM.pdf 美团:深入FFM原理与实践

2018-07-24 10:42:27 464 0

原创 linux命令ps aux|grep xxx详解

ps命令(Process Status)进程查看命令 如果直接用ps命令,会显示所有进程的状态,通常结合grep命令查看某进程的状态。 grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把...

2018-07-22 21:57:37 4241 0

提示
确定要删除当前文章?
取消 删除