自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AI黑板报的专栏

Pain makes people change...

  • 博客(46)
  • 收藏
  • 关注

原创 干货|机器学习开端综述(入门必看系列)

1.引言本来这系列文章是准备各个击破讲解下传统机器学习常用算法,但是突然发现没有对机器学习算法做一个整体的介绍,本篇机器学习开端综述带大家过一遍传统机器学习算法,基本思想和用途,本文谨代表我个人的观点和感悟,希望对大家有所帮助,欢迎大家一起讨论与学习!2.机器学习算法概述机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理...

2019-01-23 17:09:20 429

原创 Ingress:k8s集群进出流量的总管

Service 对象,它是 Kubernetes 内置的负载均衡机制,使用静态 IP 地址代理动态变化的 Pod,支持域名访问和服务发现,是微服务架构必需的基础设施。。

2023-05-16 13:18:53 401

原创 JAVA多线程中数据一致性的问题

在现代计算机系统中,多核处理器成为越来越普遍的事实。由于CPU的主频不再翻倍,同时发展方向也逐渐转向多核,使得并行计算成为计算机的发展趋势。然而,多线程并发处理带来的问题也开始受到更多的关注,其中数据一致性问题尤其引起了人们的注意。

2023-05-03 01:18:34 1475

原创 极速高效:掌握 Java 协程编程艺术

协程又是一种轻量级资源,即使创建了上千个协程,对于系统来说也不是很大的负担,但如果在程序中创建上千个线程,那系统可真就压力山大了。可以说,协程的设计方式极大地提高了线程的使用率。

2023-04-26 21:15:52 429

原创 Java多线程调优之减少上下文切换

上下文切换是多线程编程性能消耗的原因之一,而竞争锁、线程间的通信以及过多地创建线程等多线程编程操作,都会给系统带来上下文切换。

2023-04-24 13:21:49 483

原创 Java乐观锁的实现原理和典型案例

在并发编程中,多个线程同时对同一资源进行操作时,需要使用锁来保证数据的一致性。乐观锁与悲观锁是两种不同的锁机制。

2023-04-17 15:50:14 5830

原创 chat-gpt私服,无障碍使用高端AI工具,欢迎免费试用~

AI时代的新玩具:用ChatGPT搭建属于自己的聊天机器人

2023-04-16 14:05:54 567

原创 Java并发编程实战笔记-Executor与线程池:如何创建正确的线程池?

Java 线程池的深入探索

2021-05-13 00:23:40 248

原创 InfluxDB—Docker安装部署influxdb以及用户认证登陆设置

使用Docker一键安装部署influxdb以及用户认证登陆配置!

2020-11-17 21:17:20 10231 1

原创 InfluxDB—数据保留策略(Retention Policies)介绍

InfluxDB—数据保留策略(Retention Policies)详解!

2020-11-17 09:29:33 6035

原创 Flink中的时间语义和Watermarks

详细介绍Flink的Event Time、Processing Time和Ingestion Time三种时间语义以及Event Time和Watermark的工作机制!

2020-11-12 14:09:58 1526

原创 Spark Streaming (一)| Spark,从入门到精通

Spark Streaming 是批处理的流式实时计算框架,支持从多种数据源获取数据,如 Kafka、TCP sockets、文件系统等。它可以使用诸如 map、reduce、join 等高级函数进行复杂算法的处理,最后还可以将处理结果存储到文件系统,数据库等。

2020-07-29 16:00:47 869

转载 MapReduce 简介

一、 MapReduce:计算框架和编程模型今天我们来聊聊一个比较基础也比较重要的内容 MapReduce,说它基础,是因为它诞生的时间实在是太久远了,并不是什么新东西,说它重要则是因为基于它的提出衍生出很多重要的技术,比如我们关心的 Spark。今天的内容主要有以下几点:Google 的三驾马车;MapReduce 编程模型与 MapReduce 计算框架;并发与并行;如何理解分布式计算框架的编程接口与背后的工程实现。1. Google 的三驾马车USNew 把计算机科学分为 4 个领

2020-07-27 22:15:45 3716

原创 HDFS 常用命令使用教程与架构简介

HDFS 常用命令使用教程,10分钟入门!

2020-07-10 16:59:11 1063

原创 Python3 - 多进程multiprocessing与多线程multithreading

多进程和多线程编程对于代码的并发执行,提升代码效率和缩短运行时间至关重要,本文带你走进Python多进程和多线程的世界!

2020-05-27 16:53:11 3308 1

原创 使用隐藏的 REST API 提交 SPARK 任务

提交spark任务的两种方式: spark-submit 以及隐藏的rest api 。

2020-01-15 13:29:27 1482 1

原创 Linux 常用运维命令 查看日志 vi 、top、less 等命令详解

vi可以分为三种状态,分别是命令模式、插入模式和底行模式。

2020-01-02 17:42:36 2086 1

原创 Apache Flume 入门教程

Apache Flume 入门教程,一文带你了解Apache Flume 数据接入的各种方式!

2019-09-07 11:33:05 1034

原创 一文搞懂深度学习中的Batch Normalization!

本文从理论和实践的角度分别介绍了Batch Normalization,并通过比较加入Batch Normalization前后网络的性能来让大家对Batch Normalization的作用与效果有更加直观的感受!

2019-04-25 15:14:07 1065

原创 一文弄懂奇异值分解(SVD)原理及应用

一文搞懂矩阵分析之奇异值分解(SVD)!

2019-03-20 22:27:06 6794 3

原创 通俗理解LightGBM算法

什么是 LightGBM,如何实现它? 如何微调参数?

2019-03-01 15:33:10 3905 1

原创 kaggle比赛必备算法XGBoost入门及实战

一文了解 xgboost 算法基本原理以及实战用法!

2019-02-19 13:41:04 4157 1

原创 机器学习中的数据泄露(Data Leakage)

带你了解什么是机器学习预测模型中的数据泄漏以及数据泄漏的迹象,并给出避免数据泄漏问题的提示和技巧!

2019-02-18 14:08:12 10985 3

原创 机器学习免费的GPU!AI程序员的福利来了~

两种可免费使用GPU的云端平台,Google云盘提供的Colab和kaggle竞赛线上平台!

2019-02-15 11:42:24 1521 4

原创 Python | Pandas Series.nunique() 用法

Pandas Series.nunique() 用法详解!

2019-02-13 09:35:55 28053 1

原创 机器学习 (四) 基于Python实现的随机森林详解

1.概述随机森林 Random Forest 是一种强大的机器学习模型,得益于各种强大的库,现在我们可以很轻松地调用它,但并不是每一个会使用该模型的人都理解它真正的实现方式,本文将用 Python 实现并解释了决策树和随机森林的工作过程。比如Scikit-Learn,让我们现在可以非常轻松地使用 Python 实现任何机器学习算法。2.随机森林简介随机森林,是用随机的方式建立一个森林,...

2019-02-12 12:02:49 4658

原创 kaggle实战之房价预测,了解一下?

在学习完各种高大上的机器学习理论知识(线性回归、逻辑回归、分类决策树、随机森林等等)之后,也许你会问这玩意儿到底有什么用?? 也许你已经按捺不住想自己好奇的心,想找到实际的数据练练手??Talk is cheap, show me the code!本篇文章就是用 kaggle 平台上实际的数据带你走进机器学习的世界,来看看,所谓的数据挖掘或者机器学习实际应用到底是怎么样一个过程。1....

2019-02-11 16:28:15 4363 3

原创 Ridge和Lasso回归:Python Scikit-Learn的完整指南

Python Scikit-Learn中 Ridge和Lasso回归详解!

2019-01-31 15:26:20 12371 1

原创 机器学习(三) 线性回归到最小二乘法

一文搞懂最小二乘法!

2019-01-29 13:26:34 1100 1

原创 从 0-1走进 Kaggle实战平台

1.什么是Kaggle?Kaggle成立于2010年,是一个进行数据发掘和预测竞赛的在线平台。从公司的角度来讲,可以提供一些数据,进而提出一个实际需要解决的问题;从参赛者的角度来讲,他们将组队参与项目,针对其中一个问题提出解决方案,最终由公司选出的最佳方案可以获得5K-10K美金的奖金。kaggle官方网站 : https://www.kaggle.com/Kaggle的创建初衷及运...

2019-01-27 21:15:17 357

原创 机器学习 (二) 分类决策树

1 引言在这一篇文章中,将讨论一种被广泛使用的分类算法—决策树(decision tree)。相比贝叶斯算法,决策树的优势在于构造过程不需要任何领域知识或参数设置,因此在实际应用中,对于探测式的知识发现,决策树更加适用。2 决策树介绍决策树是一种机器学习的方法,决策树的生成算法有ID3, C4.5 和 C5.0 等。决策树是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个...

2019-01-22 22:23:03 2002

原创 深度学习教程(二) TensorFlow基本用法讲解

前言TensorFlow 是一个用于研究和生产的开放源代码机器学习库,提供了各种级别的 API,供大家自由选择。高阶 API:1.Keras (快速设计原型、模块化代码)2.Eager Execution (命令式编程环境,可立即输入结果,无需构建图)低阶 API:1.张量2.session会话…TensorFlow 官方网站推荐使用的高阶 API 进行构建机器学习模型,但...

2019-01-20 20:07:53 354

原创 深度学习教程(三) 神经网络RNN(2)

在进行实际编码之前,我们先介绍下深度学习的三个要素:李航博士曾在《统计机器学习》中提到:统计学习方法三要素:模型、策略和算法.我认为深度学习也有这三要素:1.模型也就是假设空间在深度学习领域,模型包括网络结构和网络中的参数(权重和偏置等)。通常所说的CNN,RNN其实就是模型,但只是深度学习的一个要素而已,只有模型是没办法学习的。在CNN被提出之时,并没有提出相应的学习策略和优化算...

2019-01-15 21:31:31 303

原创 深度学习教程(一) 一键安装TensorFlow开发环境

工欲善其事,必先利其器。制约人真正发展的个人技术能力和经验是一方面,所使用的工具也是一方面,所谓磨刀不误砍柴工,一个好的工具可以让你起到事半功倍的效果。深度学习研究的热潮持续高涨 ,近几年许多的开源深度学习框架也层出不穷 ,比如 TensorFlow、Caffe、Keras、PyTorch、CNTK等等,其中 ,TensorFlow 由谷歌大脑团队研发 ,在DL领域处于领先地位。本文主要讲解...

2019-01-14 17:14:09 653

原创 一些有趣且鲜为人知的 Python 特性

一些有趣且鲜为人知的 Python 特性.代码解释代码解释GitHub 上有个非常有意思的仓库(What the f*ck Python!) ,作者收集了很多有趣且鲜为人知的 Python “特性”,这个有趣的项目意在收集 Python 中那些难以理解和反人类直觉的例子,并尝试讨论这些现象背后真正的原理!而所有的一切,其实都是 Cpython 内部实现中利弊之间的的权衡,有优点就有缺点,举个...

2019-01-14 12:55:42 281

原创 Tensorflow中优化器--AdamOptimizer详解

一.什么是Adam算法?Adam 这个名字来源于自适应矩估计(Adaptive Moment Estimation),也是梯度下降算法的一种变形,但是每次迭代参数的学习率都有一定的范围,不会因为梯度很大而导致学习率(步长)也变得很大,参数的值相对比较稳定。如果一个随机变量 X 服从某个分布,X 的一阶矩是 E(X),也就是样本平均值,X 的二阶矩就是 E(X^2),也就是样本平方的平均值。A...

2018-11-13 13:51:45 67701

原创 数据预处理--One Hot Encoding 详解

One Hot Encoding 是将分类变量转换为可以提供给ML算法以在预测中做得更好的形式的过程。

2018-11-09 16:27:22 1005

原创 Linux常用命令总结---不断更新中

1,linux下强制关掉tomcat进程:ps -a | grep java #拿到tomcat的进程号xxx,然后~kill -9 xxx2,查看定时任务: cat /etc/crontab如下:[root@b507Server2 bin]# cat /etc/crontabSHELL=/bin/bashPATH=/sbin:/bin:/usr/sbin:/usr/binMAILTO

2016-04-26 11:06:51 410

原创 Android Studio常用快捷键---不断更新中

Android Studio是Google开发的一款面向Android开发者的IDE,支持Windows、Mac、Linux等操作系统,基于流行的Java语言集成开发环境IntelliJ搭建而成。 Android Studio是一款官方的Android开发工具,可以说是以后的趋势,下面总结一些Android Studio中常用的快捷键:Alt+Insert可以生成构造器/Getter/Setter

2016-04-25 21:12:09 297

转载 八大排序算法的 Python 实现

1、插入排序 def insert_sort(lists): # 插入排序 count = len(lists) for i in range(1, count): key = lists[i] j = i - 1 while j >= 0: if lists[j] > ke

2016-04-24 23:01:20 260

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除