学习提升
「已注销」
这个作者很懒,什么都没留下…
展开
-
BitMap与HyperLogLog原理详解
一、BitMap算法详解所谓的BitMap就是用一个bit位来标记某个元素所对应的value,而key即是该元素,由于BitMap使用了bit位来存储数据,因此可以大大节省存储空间。基本思想这此我用一个简单的例子来详细介绍BitMap算法的原理。假设我们要对0-7内的5个元素(4,7,2,5,3)进行排序(这里假设元素没有重复)。我们可以使用BitMap算法达到排序目的。要表示8个数,我们需...转载 2019-07-30 18:47:27 · 2742 阅读 · 3 评论 -
Scala学习笔记
Scala学习第一个 Scala 程序:Hello Worldobject HelloWord { def main(args: Array[String]) Unity= { println("Hello, world!") }}简介Scala简介Scala 是 Scalable Language 的简写,是一门多范式的编程语言联邦理工学院洛桑(...原创 2019-08-29 18:24:15 · 242 阅读 · 0 评论 -
redis 基础教程
redis 基础教程http://www.runoob.com/redis/redis-tutorial.htmlredis 简介Redis 简介Redis 是完全开源免费的,遵守BSD协议,是一个高性能的key-value数据库。Redis 与其他 key - value 缓存产品有以下三个特点:Redis支持数据的持久化,可以将内存中的数据保持在磁盘中,重启的时候可以再次加载进...原创 2019-08-29 18:25:29 · 630 阅读 · 0 评论 -
Python学习
Python学习一· 函数参数1.数据类型的检查可以用 isinstance() 函数来实现def my_abs(x): if not isinstance(x, (int, float)): raise TypeError('bad operand type') if x >= 0: return x else: ...原创 2019-08-29 18:26:36 · 282 阅读 · 0 评论 -
常用服务器日志分析命令大全
常用服务器日志分析命令大全1、查看有多少个IP访问:awk '{print $1}' log_file|sort|uniq|wc -l# wc -l 看看有多少行2、查看某一个页面被访问的次数:grep "/index.php" log_file | wc -l3、查看每一个IP访问了多少个页面:awk '{++S[$1]} END {for (a in S) print a,...原创 2019-08-29 18:27:33 · 390 阅读 · 0 评论 -
AWK程序设计语言
AWK程序设计语言一. AWK入门指南Awk是一种便于使用且表达能力强的程序设计语言,可应用于各种计算和数据处理任务。1.1 起步有用的awk程序往往很简短,仅仅一两行。假设你有一个名为 emp.data 的文件,其中包含员工的姓名、薪资(美元/小时)以及小时数,一个员工一行数据,如下所示:姓名薪资小时数Beth4.000Dan3.750kath...原创 2019-08-29 18:29:04 · 152 阅读 · 0 评论 -
linux awk命令详解
linux awk命令详解简介awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。awk有3个不同版本: awk、nawk和gawk,未作特别说明,一般指gawk,gawk 是 AWK 的 GNU 版本。awk其名称得自于它的创始...原创 2019-08-29 18:30:24 · 737 阅读 · 0 评论 -
ES 知识点
一、ES基于_version 进行乐观锁并发控制post /index/type/id/_update?retry_on_conflict=5&version=61.内部版本号第一次创建document的version版本号为1,以后每次对这个document修改或删除操作,version自动加1。同时带上数据的版本号,确保es中数据的版本号,跟客户端中的数据的版本号是相同...原创 2019-09-11 17:35:44 · 153 阅读 · 0 评论 -
elasticsearch的keyword与text的区别
es2.*用户可忽略该文章。es 2.*版本里面是没有这两个字段!!!当初接触es,最惊讶就是他的版本速度发布太快,这次主要讨论keyword与text的区别在es 2.*版本里面是没有这两个字段,只有string字段。5.*之后,把string字段设置为了过时字段,引入text,keyword字段这两个字段都可以存储字符串使用,但建立索引和搜索的时候是不太一样的keyw...原创 2019-09-11 17:37:37 · 337 阅读 · 0 评论 -
机器学习--Logistic回归计算过程的推导
1.引言看了Stanford的Andrew Ng老师的机器学习公开课中关于Logistic Regression的讲解,然后又看了《机器学习实战》中的LogisticRegression部分,写下此篇学习笔记总结一下。首先说一下我的感受,《机器学习实战》一书在介绍原理的同时将全部的算法用源代码实现,非常具有操作性,可以加深对算法的理解,但是美中不足的是在原理上介绍的比较粗略,很多细节没有具...原创 2019-09-11 17:42:29 · 160 阅读 · 0 评论 -
GBDT 算法:原理篇
GBDT 算法:原理篇tags: 学习笔记 机器学习 GBDTGBDT 是常用的机器学习算法之一,因其出色的特征自动组合能力和高效的运算大受欢迎。这里简单介绍一下 GBDT 算法的原理,后续再写一个实战篇。1、决策树的分类决策树分为两大类,分类树和回归树。分类树用于分类标签值,如晴天/阴天/雾/雨、用户性别、网页是否是垃圾页面;回归树用于预测实数值,如明天的温度、用户的年龄、网页的...原创 2019-08-29 18:22:24 · 270 阅读 · 0 评论 -
机器学习相关算法介绍
GBDTBoosted Trees & xgboost 介绍FTRL在线学习算法FTRL详解点击率预估算法:FM与FFM在线最优化求解(Online Optimization)原创 2019-08-29 18:21:05 · 265 阅读 · 0 评论 -
Slf4j和Log4j的区别
log4j 大家都知道,就不在多说了,重点说说slf4j;简单日记门面(simple logging Facade for Java)SLF4J是为各种loging APIs提供一个简单统一的接口,从而使得最终用户能够在部署的时候配置自己希望的loging APIs实现。准确的说,slf4j并不是一种具体的日志系统,而是一个用户日志系统的facade,允许用户在部署最终应用时方便的变更其日志...转载 2019-08-29 17:19:39 · 9109 阅读 · 0 评论 -
布隆过滤器核心原理&redisBitMap 分布式实现
Data structures are nothing different. They are like the bookshelves of your application where you can organize your data. Different data structures will give you different facility and benefits. To ...原创 2019-07-30 20:37:29 · 3630 阅读 · 0 评论 -
HashMap原理与源码解读
Map 综述(一):彻头彻尾理解 HashMap一、HashMap概述Map 是 Key-Value 对映射的抽象接口,该映射不包括重复的键,即一个键对应一个值。HashMap 是 Java Collection Framework 的重要成员,也是Map族(如下图所示)中我们最为常用的一种。简单地说,HashMap 是基于哈希表的 Map 接口的实现,以 Key-Value 的形式存在,即存...转载 2019-07-28 17:50:58 · 91 阅读 · 0 评论 -
LinkedHashMap原理与源码解读
HashMap和双向链表合二为一即是LinkedHashMap。所谓LinkedHashMap,其落脚点在HashMap,因此更准确地说,它是一个将所有Entry节点链入一个双向链表的HashMap。由于LinkedHashMap是HashMap的子类,所以LinkedHashMap自然会拥有HashMap的所有特性。比如,LinkedHashMap的元素存取过程基本与HashMap基本类似,只是...转载 2019-07-28 18:16:08 · 115 阅读 · 0 评论 -
ConcurrentHashMap原理与源码解读
一. ConcurrentHashMap 概述HashMap 是 Java Collection Framework 的重要成员,也是Map族(如下图所示)中我们最为常用的一种。不过遗憾的是,HashMap不是线程安全的。也就是说,在多线程环境下,操作HashMap会导致各种各样的线程安全问题,比如在HashMap扩容重哈希时出现的死循环问题,脏读问题等。HashMap的这一缺点往往会造成诸多不...转载 2019-07-28 20:46:56 · 219 阅读 · 0 评论 -
Hadoop常用命令
启动Hadoop进入HADOOP_HOME目录。执行sh bin/start-all.sh关闭Hadoop进入HADOOP_HOME目录。执行sh bin/stop-all.sh1. 查看指定目录下内容hadoop dfs –ls [文件目录]eg: hadoop dfs –ls /user/wangkai.pt2. 打开某个已存在文件hadoop dfs –cat [file_p...原创 2019-07-28 20:59:55 · 205 阅读 · 0 评论 -
免除设置 linux服务器git pull/push时提示输入账号密码
1、先cd到根目录,执行git config --global credential.helper store命令 git config --global credential.helper store2、执行之后会在.gitconfig文件中多加红色字体项[user] name = username email = xxxx@xxxx.com[crede...原创 2019-07-28 21:05:05 · 115 阅读 · 0 评论 -
Java final关键字用法注意点
Java final关键字用法注意点(按照Java代码惯例,final变量就是常量,而且通常常量名要大写:)final关键字声明的static变量(属于类)必须在声明、类初始化(static{})的时候初始化,而且不能重复赋值;而非static变量(属于对象),必须在声明、对象初始化({}方法)或者构造函数里面初始化,也不可以重复赋值。(有例子)final static作为常量的时候,jv...原创 2019-08-16 12:21:29 · 632 阅读 · 0 评论 -
Java8 特性详细教程
Java 8 特性官方网址https://wizardforcel.gitbooks.io/java8-tutorials/content/index.html原创 2019-08-16 12:27:36 · 165 阅读 · 0 评论 -
Java设计模式——设计原则
一、单一职责原则应该有且仅有一个原因引起类的变更。单一职责原则的好处:类的复杂性降低,实现什么职责都有清晰明确的定义;可读性提高,复杂性降低,那当然可读性提高了;可维护性提高,可读性提高,那当然更容易维护了;变更引起的风险降低,变更是必不可少的,如果接口的单一职责做得好,一个接口修改只对相应的实现类有影响,对其他的接口无影响,这对系统的扩展性、维护性都有非常大的帮助。注意: 单一...原创 2019-08-26 19:00:37 · 149 阅读 · 0 评论 -
Git使用教程:最详细、最傻瓜、最浅显、真正手把手教!
(预警:因为详细,所以行文有些长,新手边看边操作效果出乎你的预料)一:Git是什么?Git是目前世界上最先进的分布式版本控制系统。工作原理 / 流程:Workspace:工作区Index / Stage:暂存区Repository:仓库区(或本地仓库)Remote:远程仓库二:SVN与Git的最主要的区别?SVN是集中式版本控制系统,版本库是集中放在中央服务器的,而干活...原创 2019-09-11 17:48:22 · 268 阅读 · 0 评论