自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 简单理解科学的证实与证伪

从古至今,科学研究的通用流程都是观测、提出假设、重复实验、得出结论,而这个通用流程的核心就在于得出结论,它决定了我们通过设计的一系列实验,观测到纷繁负载的实验结果,到底能得到什么。当今大多数的学者都认为,所谓科学就是一些我们提出来用来描述自然规律的定理,例如,地球是围绕太阳旋转,或是太阳是围绕地球旋转等等。科学的证实与证伪的理论决定了我们能从科学中得到怎样的信息,对于任何科学研究都具有底层的重要作用。想要分析证实与证伪的哲学概念,首先要定义清楚科学的概念,明确“科学是什么”。实证主义认为,一个新的理论,或者

2022-06-16 14:44:47 27836 1

原创 WIN10底部任务栏卡死解决方案

看了别人的好多解决方案,比如按win+R改东西解决什么的,但是我的问题是连win+R都没反应。后面看到大家都说的是把资讯和兴趣关闭就好(垃圾微软),而且发现在刚刚重启资源管理器的一秒钟之内,任务栏功能是正常的。于是。。。1)alt+Ctrl+del打开任务管理器。2)在做好充分准备(左手放在按键O上,鼠标靠近任务栏),时点击重启windows资源管理器进程。3)以极高的手速移动到任务栏上点击右键,滑动到咨询和兴趣,点击O键。没成功就多试几次,没啥损失。弄好之后马上就正常.

2022-03-03 10:14:46 5598 12

原创 分布式系统负载均衡策略分析与研究

负载均衡(Load Balance)是分布式系统架构设计中必须考虑的因素之一,它通常是指将请求/数据均匀分摊到多个操作单元上执行,负载均衡的关键在于平均整体节点间的负载。常见的分布式系统的扩展可分为纵向(垂直)扩展和横向(水平)扩展。纵向扩展是指增强单机处理能力的角度来增强整体集群的处理能力,然而更为广泛的,更适用于分布式处理系统中的方式是横向扩展,即添加更多节点的方式来增强集群处理能力。能够便捷、快速、稳定的增减集群节点数量是现代分布式系统的核心功能之一,同时这个能力也满足了高可用性与可管理性的要求。分布

2021-12-26 16:50:40 2943

原创 常见的激活函数及对比分析

激活函数的概念神经网络中的每个神经元节点接受上一层神经元的输出值作为本神经元的输入值,并将输入值传递给下一层。在多层神经网络中,上层节点的输出和下层节点的输入之间具有一个函数关系,这个函数称为激活函数(又称激励函数)。以一个简单的全连接神经网络为例,上一层输出的结果会乘以权重后输入到这一层的每个节点中,而这一层的每个节点会将输入经过激活函数后向下传递。激活函数对于人工神经网络理解非常复杂和非线性的函数来说具有十分重要的作用。它们将非线性特性引入到我们的网络中。如果没有激活函数,则神经网络就是很..

2021-11-02 10:01:47 764

原创 常见正则化方法及对比分析

一、正则化的概念我们使用机器学习方法训练一个模型,其最终目的是得到一个能够最大程度概括整体空间内的数据特征。然而由于训练数据往往是整体空间数据一个样本,因此在使用训练样本训练模型的时候有可能出现过拟合的情况。这里以一个简单的回归模型来说明一个模型的拟合程度。图1图1 就是三种模型的拟合程度,图1左表示欠拟合,也就是得到的模型并没有足够的拟合样本数据的特征;图1右则是过拟合的情况,模型被设计的过于复杂,或者在训练集上进行了过度的训练,使得模型能够完全的贴合样本空间。但是,我们希望得到的模.

2021-10-08 16:55:13 5266 1

原创 解决OtterTune部署时前端样式丢失的问题

最近在尝试着自己部署一下OtterTune的项目,并且为以后魔改做做准备,但是在成功运行项目并且让Django的后端跑起来之后,发现前端的CSS样式丢失了,并且好多正常的功能也都没办法做。因为OtterTune毕竟是17年的“老”项目了,所以首先尝试了安装17年的Chrome浏览器,发现不是浏览器的问题。迫不得已,打算自己修改项目代码。后面发现问题主要出在ottertune/server/website/website/static/css/boo...

2021-08-20 10:47:40 255

原创 在Ubuntu20.04上安装Python虚拟环境

首先通过pip安装必要的虚拟环境包。sudo apt-get install python-virtualenvsudo easy_install virtualenvwrapper第二步遇到报错找不到命令easy_install,找到的解决方法是用命令sudo python3 -m easy_install virtualenvwrapper代替,然后成功安装好了这两个包。然后打算运行虚拟环境。先创造虚拟环境的地址mkdir $HOME/.virtualenvs。然后就创建我们的虚拟环境,

2021-08-05 09:39:37 681

原创 在Ubuntu20.04上安装Mysql5.6

因为Ubuntu20.04比较新,而Mysql5.6比较老,所以这两者之间的支持不太好。也不知道是服务器本身就有啥问题,还是两者软件的支持不足,我在安装Mysql5.6的时候遇到了很多困惑和问题。2.1 彻底卸载MYSQL因为不清楚服务器的具体状况,前面也实验了很多次都失败了,所以要先彻底的清除Mysql,然后再进行后续的安装。第一,使用命令dpkg --list|grep mysql查看跟Mysql相关的包。第二,首先卸载common包。sudo apt-get remove mysq..

2021-08-03 15:02:47 6295 6

原创 《使用多目标优化的基于Spark的云数据分析》阅读报告

2021.7.15这篇文章[1]发表于ICDE2021,作者Fei Song等人。之所以选择这篇文章是因为由2017年OtterTune发表以来,人们发现类似于数据库、Spark框架等的配置调整依然大量依赖人工经验的调整,而使用机器学习的方法无疑可以在这个思路下挖掘出很多调参的潜力。这是一种全新的利用机器学习进行系统配置调整的新思路。而这个研究思路近几年也十分流行,包括一系列的数据库调参论文[2-6]的发表,还是这篇文章将这个思路迁移到Sp...

2021-07-18 11:38:36 632

原创 Pareto Principle

最近在看ICDE2021的调优文章时发现出现了大量的Pareto Set的理论,这里记录一下。一、Pareto理论 由意大利经济学家维弗雷多·帕雷托 (Villefredo Pareto)(图1)在1987年提出:社会财富的80%是掌握在20%的人手中,而余下的80%的人只占有20%的财富。这个概念被延伸到别的社会领域,得到了帕累托理论,即对于大多数的结果,大约80%的后果来自20%的原因。这也就指出大多数情况下都存在“关键的少数”群体,这个理论也被称为80/20理论。...

2021-07-16 10:22:39 672

原创 NP-Hardness

科研小白,在很多文章中都涉及到了NP-Hardness的概念。因为以前都没有接触过这个概念,这里记录一下。一、P vs NP问题 想要理解这个问题,首先要了解 P vs NP问题。 他表示一个可以快速验证的问题能否存在快速解决的方法。快速指存在一种算法,可以在多项式的时间内运行。这里涉及到另一个概念,多项式时间(polynomial time),指一个算法的运行时间上限受到与输入相关的多项式的限制,与之矛盾的类似于指数时间。 于是,可...

2021-07-15 16:57:04 1447

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除