基础知识
文章平均质量分 79
iterate7
阳春布德泽,咱能生光辉?
百川东到海,不能复西归,
少壮要努力,以免徒伤悲!
展开
-
cart回归树:练手+sklearn
背景cart树作为决策树的一种,在非常多的地方被使用。既可以用于分类问题,也可以用于回归问题。分类问题则非常容易理解,利用gini系数较大的特征进行样本分裂,从而构建一颗分类树。 今天我们要探讨的是回归树。回归树cart简介回归树,则目标函数则是平方差,也就是说,分完之后形成left和right子树,每个子树对label,也就是y,进行平方差的计算。最后左右子树的平方差之和则是评估标注。 ...原创 2020-02-23 20:43:08 · 2298 阅读 · 0 评论 -
mac OWLVis安装
OWLVis介绍如果我们需要管理类似KG知识图谱的东西,可以使用protege。这款斯坦福共享的软件非常棒。也有网页版:webpretege.stanford.edu.但是我们需要观察更细致的树形结构:如何安装但是安装之后仍然遇到: dot的问题 /usr/local/bin/dot no such file问题。那么我们需要安装dot。brew install GraphVis ...原创 2020-01-16 21:30:26 · 243 阅读 · 0 评论 -
python并行加速之: multiprocessing, multithread
背景对于java的多线程问题,可以方便利用disrupt架构。在python则一般是使用multiprocessing和multithread两种解决方案,前者是基于cpu; 后者基于多线程。具体方案Process 方案def f(x, ret): ret[x] = x*x def task_multiprocessing_get(): ret = {} ...原创 2019-11-03 21:24:04 · 2452 阅读 · 0 评论 -
cpu thread core lscpu
cpu thread corelscpu[root@localhost ~]# lscpuArchitecture: x86_64CPU op-mode(s): 32-bit, 64-bitByte Order: Little EndianCPU(s): 24On-line CPU(s) list: ...原创 2018-11-15 09:03:30 · 1834 阅读 · 0 评论 -
7z centos 安装和源码安装
如何在centos里安装7z压缩和解压缩软件答: yum install -y p7zip原创 2018-12-29 14:15:36 · 1940 阅读 · 0 评论 -
apache maven install notes
introduction(what)if we want to use commands to package, install or deply base MAVEN. let’s install it at mac.howdownloadhttps://maven.apache.org/download.cgiunzipunzip apache-maven-3.6.0.zips...原创 2019-03-25 14:17:40 · 113 阅读 · 0 评论 -
如何利用conda建立的虚拟空间在jupyter里开发
conda安装之后使用命令行将anaconda的bin目录加入PATH,根据版本不同,也可能是~/anaconda3/binecho ‘export PATH="~/anaconda2/bin:$PATH"’ >> ~/.bashrc更新bashrc以立即生效source ~/.bashrc如果mac安装了zshrc怎么办,简单修改~/.zshrc文件,在其中添加:sour...原创 2019-08-29 11:29:44 · 276 阅读 · 0 评论 -
pyscaffold建立项目管理
pyscaffold新建一个python项目的管理软件。一个命令就可以PyScaffold helps you to easily setup a new Python project.安装三种方法:1. pip install pyscaffold2. pip install pyscaffold[all]3. conda install -c conda-forge pyscaf...原创 2019-09-01 11:21:43 · 1000 阅读 · 0 评论 -
机器学习的第一步:数据预处理
背景以前讲过一篇关于特征缩放的,其实本质也是特征预处理,使得标注化。https://blog.csdn.net/iterate7/article/details/78881562这里主要是巩固,同时结合sklearn里的代码直接来看。标准化z-score方法x′=x−μσx' = \dfrac{x - \mu}{\sigma}x′=σx−μ翻译公式为:(x-mean)/std 计...原创 2019-10-05 11:08:49 · 1009 阅读 · 0 评论 -
GridSearch & Kfold & cross validation
what’s cross validation?Cross-validation is a technique that is used for the assessment of how the results of statistical analysis generalize to an independent data set. Cross-validation is largely u...原创 2019-10-06 09:02:01 · 672 阅读 · 0 评论 -
intellij idea 管理module和project,以及git管理项目
introduction这篇笔记主要包括两部分内容,第一部分是介绍idea如何操作project和module。第二部分则是创建git项目,然后idea中导入项目,然后创建多个module,以及一些基础的add,commit,push操作。下面的git操作适用于github和gitlab。两者没太多本质区别。先说一下相同点,二者都是基于web的Git仓库,在很大程度上GitLab是仿照G...原创 2018-10-12 11:16:29 · 3033 阅读 · 0 评论 -
elasticsearch 5+ head的三种安装方法
自从elasticsearch 5.0 之后,因为大统一的原因,head插件有不大变化;以前是直接解压缩,现在变为node开发。第一种,npmgit clone git://github.com/mobz/elasticsearch-head.gitcd elasticsearch-headnpm installnpm run start第二种,dockerf...原创 2018-09-11 23:33:28 · 1004 阅读 · 0 评论 -
几个概率分布总结
贝努里一次抛掷n枚相同的硬币,可以等价于:每次抛掷一枚硬币,共抛掷n次。原因在于每次实验是相互独立的。 一般来讲,如果实验E只有两种可能的结果:AAA和A¯A¯\bar{A},并且p(A)=pp(A)=pp(A)=p,p(A¯)=1−p=qp(A¯)=1−p=qp(\bar{A})=1-p=q。 把E独立地重复n次实验构成一个实验,这个实验称作贝努里实验(Bernoulli),或贝努里概率...原创 2017-08-22 20:30:41 · 1574 阅读 · 0 评论 -
LSTM和循环网络RNN学习简记
前馈网络回顾要理解循环网络,首先需要了解前馈网络的基础知识。这两种网络的名字都来自于它们通过一系列网络节点数学运算来传递信息的方式。前馈网络将信息径直向前递送(从不返回已经过的节点),而循环网络则将信息循环传递。在前馈网络中,样例输入网络后被转换为一项输出;在进行有监督学习时,输出为一个标签。也就是说,前馈网络将原始数据映射到类别,识别出信号的模式,例如一张输入图像应当给予“猫”还是“大象”的标签。原创 2017-07-29 11:24:39 · 3452 阅读 · 0 评论 -
java细节
java语言规范语言的本质任何一门语言都是用来交流的,都有自己的一套书写规范,Java 也不例外。不遵循规范,则会产生交流问题。注重这些细节有几个好处好的命名规范可以使得写出来的程序更容易被别人理解,更好维护。当然也易于自己理解,以便日后扩展。同时,也使程序更规范和专业。 在这个人性化横行的今天,我们的Java命名规范也应该注重体验。共性和个性应该并存。共性则是专业、规范...原创 2017-09-26 16:41:08 · 252 阅读 · 0 评论 -
线性代数笔记:行列式和矩阵;以及具体实战
二阶和三阶行列式,以及n阶行列求解方法;分别用java和python-numpy实现了一下,加深理解。原创 2017-09-23 19:01:30 · 747 阅读 · 0 评论 -
范数和正则化
概念范数是具有“长度”概念的函数。在向量空间内,为所有的向量的赋予非零的增长度或者大小。不同的范数,所求的向量的长度或者大小是不同的。原创 2017-11-11 17:42:57 · 2972 阅读 · 0 评论 -
异或XOR的再理解以及在leetcode上的应用
异或0和0异或产生0,0和1; 1和0异或得到1;1和1异或得到0。 简单总结:不同的产生1;否则0。代表的是差别。 补充AND,OR。AND 0&0=0 1&1=1 0&1=0 只有两个同时满足才能满足。OR 0|0=0 1|1=1 0|1=1 只要有一个满足就满足。再理解:异或的操作,如同...原创 2018-04-12 14:17:36 · 2050 阅读 · 1 评论 -
leetcode 807. Max Increase to Keep City Skyline(不变天际线的最大化)
题目In a 2 dimensional array grid, each value grid[i][j] represents the height of a building located there. We are allowed to increase the height of any number of buildings, by any amount (the amounts...原创 2018-04-30 23:48:44 · 404 阅读 · 1 评论 -
代码的习惯坚持
代码是落地代码是最终工程师的结果呈现,其中包括了本身的业务的实现,代码的习惯,逻辑的展现,代码的质量,甚至一些个人风格。基础标准个人理解,基础的业务满足,代码清晰,无逻辑bug,代码稳定,符合标准规范和具有一定的可读性这是一个基础。追求的一些标准这里罗列一些想法,供参考。也要求自己按照这个习惯坚持下去。 0. 先做到业务满足、代码清晰、无bug、稳定、符合规范。至于符合规...原创 2018-05-29 10:43:15 · 348 阅读 · 0 评论 -
elasticsearch mysql mongodb 底层设计
elasticsearch mysql mongodb SQL术语/概念 MongoDB术语/概念 elasticsearch 解释/说明 database database index 数据库 table collection type 数据库表/集合 row document document 数据记录行/...原创 2018-08-29 23:52:48 · 475 阅读 · 0 评论 -
随机数产生器(random number generator)
随机数产生器随机数一般分为真正的随机和伪随机(pseudorandom number generator (PRNG))。真正的随机则是不可预测;伪随机则依靠随机数种子和随机算法,是可能被预测的。 只依靠计算机程序,不依赖硬件和外部噪音能否产生真正的随机? 个人分析: 不可能。原因如下:种子是可选择的,产生序列的算法代码也是固定的,那么这个序列则是可以预测,即使引入“时间”这种动态的变量原创 2015-12-27 12:14:55 · 19605 阅读 · 1 评论