redis入门

包括7个方面:入门简介,可存储数据类型,配置文件解读,持久化机制,事务,复制,java操作客户端一、reidis入门     问题:MySQL数据库也经常存储一些大文本字段,导致数据库表非常的大,在做数据库恢复的时候就导致非常的慢,不容易快速恢复数据库。比如1000万4KB大小的文本就接近40GB...

2019-02-10 10:42:54

阅读数 45

评论数 0

ReentrantLock实现条件通知

        Synchronized和ReenTrantLock都可以实现同步队列,ReenTrantLock可以实现更多的功能,比如条件通知,自己实现了一个生产者消费者模型。         首先简单讲一下它们的区别:         两者都是可重入锁,         Synchro...

2019-01-21 14:41:33

阅读数 31

评论数 1

xgboost原理详解

 本篇文章来自实习的时候我在小组里的一次xgboost分享。  自己也是参考了很多资料加上自己的理解,如有错误的地方请各位大大指教,谢谢 基础 1、泰勒公式   2.、优化方法(梯度下降,牛顿法,拟牛顿等等)   3、回归树与GBDT    4、思想(GBDT的一种):xgboo...

2018-11-06 15:50:24

阅读数 253

评论数 0

Elasticsearch知识点总结

       实习期间接触到了Elasticsearch,所以就系统的学习了一下 Elasticsearch。本文是自己在Elasticsearch学习过程 中的知识结构总结,这样对Elasticsearch有一个全貌的认识,具体的细节点和开发可参考本文找对应的资料。         一、什...

2018-10-29 18:56:42

阅读数 145

评论数 0

spring MVC运行过程分析与源码实现

spring mvc 启动过程可分为如下3步: =============================================                             web.xml                           DispatcherServle...

2018-09-17 16:33:13

阅读数 71

评论数 0

spark数据倾斜原因与解决方法大总结

总结自:https://www.cnblogs.com/xiaodf/p/6055803.html 数据倾斜调优   调优概述 有的时候,我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜,此时Spark作业的性能会比期望差很多。数据倾斜调优,就是使用各种技术方案解决不同类型的数据倾斜...

2018-07-17 17:15:11

阅读数 1118

评论数 1

mysql数据导入hive

利用 sqoop 将线上mysql表导入hive的模板代码如下:   source /etc/profile; sudo -uflightdev sqoop import \ --connect jdbc:mysql://127.0.0.1:3306/%(mysql_db...

2018-07-17 17:11:19

阅读数 723

评论数 1

动态规划思想轻松理解(java)

      动态规划出现在很多算法题目里面,初学者入门并不容易,网上很多文章看了以后还是不是很理解什么的动态规划算法,就打算记录一下自己的笔记,用案例加详细说明的方式深入理解动态规划的核心思想。      以lletcode198题目为例(抢金店),不熟悉题目的同学可以百度一下~这是一个典型的动态...

2018-04-16 11:36:49

阅读数 202

评论数 0

自然语言处理(NLP)知识结构总结

       自然语言处理知识太庞大了,网上也都是一些零零散散的知识,比如单独讲某些模型,也没有来龙去脉,学习起来较为困难,于是我自己总结了一份知识体系结构,不足之处,欢迎指正。内容来源主要参考黄志洪老师的自然语言处理课程。主要参考书为宗成庆老师的《统计自然语言处理》,虽然很多内容写的不清楚,但好...

2018-03-17 18:04:35

阅读数 39368

评论数 4

浅入浅出深度学习理论与实践

一篇非常好的介绍深度学习的文章,原文链接如下:https://mp.weixin.qq.com/s?__biz=MzA3MDg0MjgxNQ==&mid=2652392354&idx=1&sn=b1728ad74b3a2488...

2018-03-15 11:03:05

阅读数 248

评论数 0

Python数据挖掘工具总结

      Python语言之所以很流行,广泛用于机器学习,数据挖掘等领域,因为它有强大的第三方库,下面我们就来做一个简单总结。     Numpy:       提供数组支持,矢量运算,以及高效的处理函数,线性代数处理等。                         参考链接:http://...

2018-03-15 10:56:41

阅读数 2361

评论数 1

最简爬虫详细解读

    一个完整的爬虫需要有以下几个部分组成:    一、网页下载器,既然是爬取网上的,就需要有一个抓取一个个网页的的工具,这就是网页下载器,有很多Python包都提供了相应功能,比如下面实例中的urllib2工具包。    二、网页解析器,当我们爬去下来一个个页面的时候,其实就是一些HTML代码...

2018-03-15 10:23:50

阅读数 183

评论数 0

XGBoost入门学习

         Kaggle 的很多比赛中,我们可以看到XGBoost有非常好的表现,那 XGBoost到底是什么以及为什么有这么好的效果,又该如何应用它呢?         XGBoost 所应用的算法就是 gradient boosting decision tree,既可以用于分类也可以用...

2018-03-15 10:06:17

阅读数 125

评论数 0

概率图模型

      概率图模型广泛应用于自然语言处理各个领域,也是机器学习里面最难的一部分内容之一,应用包括贝叶斯,HMM,CRF等等,初学者很难理清楚之间的关系。本文算是一个总结吧,有不妥之处,欢迎指正。,下面这个图来自《自然语言处理》教程。                             可以...

2018-03-13 16:11:38

阅读数 394

评论数 0

动态代理模式(实例讲解)

        最开始接触设计模式是从《大话设计模式》开始,虽然是用C# 写的,非常浅显易懂,后来在学习java EE 框架实践中才慢慢体会到设计模式的妙处。          代理模式是一种重要的设计模式,在mybatis和Spring IOC 中都有重要的应用,所以理解其思想,是学习sprin...

2018-03-12 19:22:38

阅读数 94

评论数 0

深度学习课程-卷积神经网络

卷积神经网络计算机视觉计算机视觉(Computer Vision)的高速发展标志着新型应用产生的可能,例如自动驾驶、人脸识别、创造新的艺术风格。人们对于计算机视觉的研究也催生了很多机算机视觉与其他领域的交叉成果。一般的计算机视觉问题包括以下几类:图片分类(Image Classification)...

2018-03-11 10:29:14

阅读数 263

评论数 0

机器学习的一些感悟(一)

          自己研究方向的社交网络,会用到一些机器学习的方法,本身自己也很感兴趣,从去年开始就开始了学习,学习经历和相关资料,代码见GitHub主页:https://github.com/lovesoft5/ml         学习机器学习大半年了,下面是自己整理的一些心得笔记     ...

2018-03-10 14:01:41

阅读数 534

评论数 1

Logistic Regression(逻辑回归)

     逻辑回归模型虽然是机器学习里面比较简单的一个模型,但是对于理解机器学习其他模型与思想有很大帮助,应用也很广泛,吴恩达在公开课deeplearing里面,也是从逻辑回归讲起的。      首先,理解一下什么是回归。在现实问题中,一些变量往往是相互依赖,相互制约,具有一定相关性。...

2018-03-06 20:19:36

阅读数 156

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭