- 博客(150)
- 资源 (6)
- 收藏
- 关注
原创 C++常用头文件
C++常用头文件#include <cstdint> for C++, or #include <stdint.h> for C.定义了一些整数类型别名,例如INT_MAX, INT_MIN,。#include <climits> for C++, or #include <limits.h> for C.该头文件定义了根据OS和编译器实现的基本整数类型限制的常量。#include <unistd.h> unix类型操作系统api的封装,
2021-08-04 12:58:59
5301
1
原创 Eigen Cheat sheet
// A simple quickref for Eigen. Add anything that's missing.// Main author: Keir Mierle#include <Eigen/Dense>Matrix<double, 3, 3> A; // Fixed rows and cols. Same as Matrix3d.Matrix<double, 3, Dynamic> B; // Fix
2020-12-21 11:14:49
392
原创 2020 NeurIPS MeetUp
NeurIPS是人工智能领域的全球顶级会议,在研一时候我导师让我开始研究推荐系统给我安排精读的第一篇论文就是来自NIPS 2008(一篇关于矩阵分解的论文),今年正好在北京朝阳区附近NIPS举办了一场线下的交流活动,我便报名参加了。大会开场有一名老外远程祝贺NIPS MeetUp的举办,随后便直接开始第一篇keynote的演讲《Principled Design of Convolutional Neural Networks》:主要讲神经网络架构搜索《强化学习与环境模型》:这篇南大的强化学习论文
2020-12-06 23:25:05
446
原创 AUC计算
AUC: Area Under Curve, 默认为ROC(receiver operating characteristic curve) Curve, 也可以指定PR(Precision Recall) curve。由于ROC曲线的X轴为False Positive Rate,Y轴为True Positive Rate,AUC是可以指 随机给定一个正样本和一个负样本,分类器输出该正样本为正的 比 输出该负样本为正 要大的概率,即 AUC = P(P_tpr > P_fpr).AUC的计算方法
2020-06-16 19:45:50
1554
原创 DeePray:深度学习推荐算法新基建
开源项目 DeePray 发布啦!针对推荐算法,特别是点击率预估领域目不暇接的诞生新模型现状,如何将心仪模型快速应用于领域内一直是一项棘手的问题,DeePray这个项目通过统一构建数据流水线,提供各类网络层组件,在此之上,以模块化设计,用组件之砖,搭建各类网络之模型,并以灵活配置式的方式提供调用接口,你也可以在DeePray的基础上,选用各类组件模块,就像玩乐高积木一样建造你自己的模型。deepray.model目录下已实现LR、FM、FFM、DeepFM、Wide&Deep、Deep&Cr
2020-06-05 21:32:05
734
2
原创 Spark伪分布式环境配置与Scala、Java、Python编程实例
本文通过收集Spark中的基本概念、在Mac上配置伪分布式环境并分别用Python、Scala、Java三种语言独立编程实现了分布式版的WordCount程序以进行测试学习,来熟悉Spark的常用操作。本文原发布于:https://fuhailin.github.io/Spark-Tutorial/ ,关注我的公众号"赵大寳Note"(ID:StateOfTheArt),回复“HelloSpa...
2020-03-09 01:00:52
1755
原创 在Mac上配置HBase伪分布式娱乐环境
HBase是运行在Hadoop分布式文件系统HDFS上进行数据存储的开源非关系型分布式数据库,2020年我尝试在Mac上配置一个伪分布式的v2.2.3 HBase环境,看看能不能进行一些基本的读写操作,以便熟悉一下分布式数据库有什么特点。三种运行模式单机模式Hbase不使用HDFS,仅使用本地文件系统ZooKeeper与Hbase运行在同一个JVM中伪分布式模式所有进程...
2020-03-04 22:25:17
941
原创 在Mac上配置Hadoop伪分布式娱乐环境
去年我曾发文记录如何在Ubuntu上配置伪分布式版的Hadoop3娱乐环境:https://fuhailin.github.io/Hadoop-Install/ ,通过配置Hadoop娱乐环境你可以熟悉Hadoop的一些基本概念与操作方式,后来我的Dell被我玩坏了,也就没法在Ubuntu上顺畅娱乐了,后来一狠心入手了现在MacBook Pro,希望它能皮实耐操一点。今天我们继续在MacOS配置一...
2020-02-29 00:34:09
468
原创 整理Sigmoid~Dice常见激活函数,从原理到实现
本文首发于我的个人博客:激活函数:https://fuhailin.github.io/activation-functions/并同步于我的公众号:赵大寳Note(ID:StateOfTheArt),回复关键词【激活函数】下载全部代码。激活函数之性质1. 非线性:即导数不是常数。保证多层网络不退化成单层线性网络。这也是激活函数的意义所在。2. 可微性:保证了在优化中梯度的可计算性。虽...
2020-02-21 10:39:03
7491
原创 智能投顾
招行聪明定投怎么做的?均线偏离法:以均线为基准线,当指数低于均线时加大定投额;当指数高于均线时减少定投额。实现在低点时多买,高点时少买,充分利用市场行情的变化,从而摊薄建仓成本,获取更高收益。https://zhuanlan.zhihu.com/p/52827083智能节流器:财富号为基金公司提供了“智能节流器”,提供拼图模式、组件库、模块库,用AI帮基金公司做智能合图,这就相当于给基金公司...
2019-07-24 18:01:14
544
转载 IPFS
IPFS——它能取代HTTP协议?现有的web协议——HTTP协议实际上已经存在很多问题。我这里引用官网https://ipfs.io/的介绍:HTTP效率低下,服务器成本昂贵使用HTTP协议从一台计算机服务器上一次只能下载一个文件,而不是同时从多台计算机中获取文件。通过P2P方式的视频传输可以节省带宽成本的60%。历史文件被删除网页的平均使用寿命为100天,大量的网站文件不能得以长期...
2019-07-23 15:46:08
1281
转载 tensorflow:input pipeline性能指南
以tf.data优化训练数据 Google开发者大会2018tensorflow:input pipeline性能指南
2019-06-10 19:08:46
552
原创 【Leetcode】K sum problem
1. Two SumBruteForce首先我们可以想到一个暴力破解的方法,每两个数字之间求和看是不是目标值,时间复杂度为O(n2)O(n^2)O(n2)vector<int> twoSum_BruteForce(vector<int> &nums, int target){ vector<int> res; for (int i...
2019-06-08 15:42:05
313
原创 MinGW
MinGWMinGW(Minamalist GNU For Windows)MinGW安装MinGW(Minamalist GNU For Windows)MinGW(Minamalist GNU For Windows)是个精简的C/C++编译器,它实际上是将经典的开源C语言编译器GCC移植到了Windows下今天才知道MinGW安装配件还可以通过命令行的方式,MinGW安装下载MinG...
2019-06-08 14:07:11
3531
转载 c++类实例化的两种方式:new与不new的区别
new创建类对象与不new区别A a;A * a = new a();以上两种方式皆可实现类的实例化,有new的区别在于:前者在堆栈中分配内存,后者为动态内存分配,在一般应用中是没有什么区别的,但动态内存分配会使对象的可控性增强。不加new在堆栈中分配内存大程序用new,小程序直接申请只是把对象分配在堆栈内存中new必须delete删除,不用new系统会自动回收内存起初刚...
2018-10-22 20:38:47
16224
原创 tensorflow中常用的计算操作
1、tf.reduce_sum从tensor的维度上面计算元素之和tf.reduce_sum( input_tensor, # 输入 axis=None, # 表示在哪个维度进行sum操作。 keepdims=None, # 表示是否保留原始数据的维度,False相当于执行完后原始数据就会少一个维度。 name=None, reduction_ind...
2018-10-22 19:09:45
1195
原创 【剑指Offer】24. 二叉搜索树的后序遍历
题目描述:输入一个整数数组,判断该数组是不是某二叉搜索树的后序遍历的结果。如果是则输出Yes,否则输出No。假设输入的数组的任意两个数字都互不相同。思路:1、序列的的最后一个数字是根节点2、二叉搜索树左子树的节点都比根节点小,右子树的节点都比根节点大。C++递归与非递归实现代码:#include <iostream>#include <vector>#in...
2018-10-20 23:05:15
194
原创 gpustat : Linux下面监控GPU状态
nvidia-smi是 Nvidia 显卡命令行管理套件,基于 NVML 库,旨在管理和监控 Nvidia GPU 设备。nvidia-smi 的输出这是 nvidia-smi 命令的输出,其中最重要的两个指标:显存占用GPU 利用率显存占用和 GPU 利用率是两个不一样的东西,显卡是由 GPU 计算单元和显存等组成的,显存和 GPU 的关系有点类似于内存和 CPU 的关系。这里推荐...
2018-10-17 15:41:18
35547
4
原创 Tensorboard 6006端口无法访问的问题
1 、写一个简单实例,完成tensorboard 日志输出功能,示例代码如下:import tensorflow as tf input1 = tf.constant([1.0, 2.0, 3.0], name='input1')input2 = tf.Variable(tf.random_uniform([3]), name='input2')output = tf.add_n([in...
2018-10-16 14:24:56
10812
11
原创 python正则表达式从字符串中提取数字
python从字符串中提取数字使用正则表达式,用法如下:## 总结## ^ 匹配字符串的开始。## $ 匹配字符串的结尾。## \b 匹配一个单词的边界。## \d 匹配任意数字。## \D 匹配任意非数字字符。## x? 匹配一个可选的 x 字符 (换言之,它匹配 1 次或者 0 次 x 字符)。## x* 匹配0次或者多次 x 字符。## x+ 匹配1次或者多次 x 字符。...
2018-10-15 17:42:39
174992
2
原创 计算广告学
计算广告学目标:将流量转化为利润,尽可能使推荐的广告被用户点击。专业术语:CTR:Click-Through-Rate,点击通过率。把一个广告所有曝光出来的次数作为总次数,把用户点击并查看广告的次数占总次数的比例叫点击率。CTR=Click times / Show times点击率是条件概率:可以表示为:Pro(click=yes |ad, page, user, time, regi...
2018-10-08 15:53:18
745
原创 笔试笔记
1、一个盒子中装有黑白两色球,其中3只红球,2只黑球,如果不放回的依次取两次球,第二次取到红球的概率?解:解:解:当第一次取到红球时,第二次取到红球的概率 P=35⋅24=310P=\frac{3}{5}\cdot \frac{2}{4}=\frac{3}{10}P=53⋅42=103当第二次取到黑球时,第二次取到红球的概率P=25⋅34=310P=\frac{2}{5}\cdot \f...
2018-09-22 00:19:53
411
原创 C++中的平方、开方、绝对值怎么计算
#include &lt;math.h&gt;//平方 pow()int a = pow(4,2);// 4的平方=16//开方int b = pow(4,0.5);// 4的平方根=2int c = sqrt(4);// 4的平方根=2
2018-09-11 21:47:53
261501
4
原创 顺时针打印矩阵
题目描述输入一个矩阵,按照从外向里以顺时针的顺序依次打印出每一个数字。 例如,如果输入如下矩阵: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16则依次打印出数字1,2,3,4,8,12,16,15,14,13,9,5,6,7,11,10.解题思路比较直观的解法: 按照顺时针一圈一圈的打印,如何确定打印的圈数呢?...
2018-09-11 17:10:50
197
原创 相似字符串
今天遇到了一个算法题目:相似字符串。题目提出了一个相似字符串的定义:形如“aba”与“xyx”相似;“abc”与“xyz”相似,要求找出输入的两个字符串中相似字符串的个数。首先我感觉这个有点类似于正则表达式,但需要根据给定的规则匹配出所有的字符串,又有点像KMP算法的过程。 这里给出一个思路: 在“最长公共字符串”这个DP问题中,用了一个矩阵来保存字符比较的状态,但在这个问题中,“aba”...
2018-09-10 00:44:13
1409
原创 编程算法面试问题笔记
代码:数组中第k大的数代码:找出一个旋转数组中的最小值一个链表,奇数位升序,偶数位降序,将其转化成完全升序的链表代码:O(1)空间复杂度判断一个整数是不是回文数代码:给定一个dictionary,以及一个长字符串,判断字符串能不能拆成dict中单词的组合代码:数组中第k大的数代码:找出一个旋转数组中的最小值一个链表,奇数位升序,偶数位...
2018-09-09 16:06:22
195
原创 Bayesian(MAP)与Maximum Likelihood(MLE)的区别
首先我们得清楚MAP与MLE的概念是什么?MAP:maximun a posteriori 最大后验估计假设θθ\theta是能够最好解释数据集DDD概率分布的参数。我们希望利用贝叶斯原理来估计参数θθ\theta: p(θ|D)=p(D|θ)∗p(θ)p(D)p(θ|D)=p(D|θ)∗p(θ)p(D)p(\theta|D)=\frac{p(D|\theta) * p(\theta...
2018-09-09 15:57:14
1039
转载 cpp中初始化vector的5种方式
Initializing like arrays :vector<int> vect{ 10, 20, 30 };Specifying size and initializing all values :int n = 3;// Create a vector of size n with// all values as 10.vector<int>...
2018-09-04 13:22:47
4107
转载 Python 头部 #!/usr/bin/python 和 #!/usr/bin/env 有区别吗?
如果你用 python xxoo.py 来运行,那么写不写都没关系,如果要用 ./xxoo.py 那么就必须加这行,这行被称为 shebang, 用来为脚本语言指定解释器.通常认为用 #!/usr/bin/env python 要比 #!/usr/bin/python 更好,因为 python 解释器有时并不安装在默认路径,例如在 virtualenv 中。#!/usr/bin/pytho...
2018-08-08 21:30:16
371
原创 将Python程序模块化执行python -m
Python 头部 #!/usr/bin/python 和 #!/usr/bin/env 有区别吗?在Python文件中指定Python解释器 https://blog.csdn.net/u011008379/article/details/79319093References: https://segmentfault.com/q/1010000000680188...
2018-08-08 20:34:57
1037
原创 Linux下的自动执行 命令行工具 Crontab踩坑记
http://www.adminschoice.com/crontab-quick-reference
2018-08-07 20:03:30
415
原创 配置ssh免密码登录
配置ssh免密码登录https://blog.csdn.net/yanzhibo/article/details/75804619 https://blog.csdn.net/superbfly/article/details/66970114 https://stackoverflow.com/questions/48328446/id-rsa-pub-file-ssh-error-in...
2018-08-03 00:27:19
1367
原创 SSH连接Ubuntu服务器无法显示中文
我本地安装使用的是Ubuntu 英文环境,通过SSH连接Ubuntu服务器后无法正确显示中文这是因为SSH连接建立过程中会把本地的语言环境发送给远程,再将返回得到的字符根据本地的语言环境进行编码解析,所以这里我需要对本地的语言环境指定为中文再连接SSH 先看一下本地的语言设置:echo %LANG , 结果显示为en-US.UTF-8 现在我们可以通过一行命令来临时改变语言环境 ex...
2018-07-29 15:01:59
4640
原创 利用SSH端口转发登陆远程内网服务器
首先一定需要一台固定IP的服务器做转发代理,而且保证我们需要连接的目标主机能够通过SSH连接这台主机主要使用命令如下:在目标主机上执行如下命令:ssh -fCNR B_port:localhost:22 B_username@B_IP 其中B_username表示代理服务器的用户名,B_IP表示代理服务器IP地址,B_port表示与目标主机建立直接转发连接的代理服务器端口,这里我...
2018-07-29 12:38:16
3803
原创 g++ error: ‘printf’ was not declared in this scope
由于“printf”是C语言的打印方法,所以在g++编译器下需要引用头文件#include <stdio.h> 或者将printf换成c++中cout打印方法同理: error: ‘nullptr’ was not declared in this scope ...
2018-07-26 00:31:36
37009
1
原创 FM因子分解机学习笔记
References: https://www.csie.ntu.edu.tw/~b97053/paper/Rendle2010FM.pdf 美团:深入FFM原理与实践
2018-07-24 10:42:27
656
原创 linux命令ps aux|grep xxx详解
ps命令(Process Status)进程查看命令 如果直接用ps命令,会显示所有进程的状态,通常结合grep命令查看某进程的状态。grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。 ps ...
2018-07-22 21:57:37
15695
原创 Install LaTeX on Ubuntu
Install LaTeX on Ubuntu or DebianLaTeX is a document markup language and a text preparation system to create documents. LaTeX is recommended to create technical or scientific articles, papers, repor...
2018-07-18 16:11:12
2941
原创 Linux Chmod命令笔记
Following are the symbolic representation of three different roles:u is for user, g is for group, o is for others, a is for all. Following are the symbolic representation of three different perm...
2018-07-13 16:44:36
374
C#线程间通信
2017-06-03
Probabilistic Matrix Factorization概率矩阵分解Python源代码
2017-01-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人