自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(95)
  • 收藏
  • 关注

原创 【一 简明数据分析进阶路径介绍(文章导航)】

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总、理解和消化,以最大化地开发数据的功能,从而发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。

2024-02-22 10:32:08 591 1

原创 【八 (3)指标体系建设-故障运营管理指标体系的关键成功因素】

故障运营管理体系建设和服务测量是相互关联的管理活动,它们共同致力于提升组织的运营效率和服务质量,这里我们试试能不能参考服务测量的关键成功因素关联出故障运营管理指标体系的关键成功因素。从服务测量的关键成功因素看故障运营管理体系的关键成功因素

2024-07-19 09:34:06 343

原创 3.7 信息安全管理

信息安全政策是一个机构信息安全的最高方针,必须形成书面文件,散发到组织内所有员工手上,并要对所有相关员工进行培训。(2)

2024-05-30 10:58:32 269

原创 3.6 质量管理理论

(死后验尸)(质量控制图和预防缺陷)

2024-05-30 10:34:28 518

原创 3.5 项目管理

(1)项目是一项有待完成的任务,且有特定的环境与要求。(2)在一定的组织机构内,利用有限资源(人力、物力、财力等)在规定的时间内完成任务。(3)任务要满足一定性能、质量、数量、技术指标等要求。

2024-05-30 09:52:28 757

原创 3.4 IT服务管理

IT服务过程方面的问题,更多的不是来自技术,而是方面。

2024-05-23 16:21:25 272

原创 3.3 IT治理

IT治理就是在信息化过程中关于。

2024-05-22 09:57:12 292

原创 3.2 运维、运营和经营

第3章 信息技术服务知识3.2 运维、运营和经营3.2.1 运维1、运维是运行维护的简称,是一种IT服务形态。2、在《信息技术服务分类与代码》(GB/T29264-20l2)中,对运行维护服务(operation maintenance service)给出的定义是“采用信息技术手段及方法,依据需方提出的服务级别要求,对其信息系统的基础环境、硬件、软件及安全等提供的各种技术支持和管理服务”。3、运维是信息系统全生命周期中的重要阶段,也是内容最多、最繁杂的部分,是对信息系统提供维护和技术支持以及其

2024-05-22 09:56:01 521

原创 3.1 产品、服务和信息技术服务

产品的广义概念是指可以满足人们需求的载体,狭义概念是指被生产出的物品。产品是一组将输入转化为输出的相互关联或相互作用的活动的结果。在经济领域中,通常也可理解为企业或组织制造的任何制品或制品的组合。总体而言,我们通常将产品定义为:人们向市场提供的能满足消费者或用户某种需求的物品或服务。,产品类别(服务、软件、硬件或流程性材料)的区分取决于其主导成分,例如流程性材料(如燃料、冷却液)、软件(如发动机控制软件、驾驶员手册)和服务(如销售人员所做的操作说明)所组成。

2024-05-20 16:50:38 719

原创 2.5 新一代信息技术

大数据的来源包括网站测览轨迹、各种文档和媒体、社交媒体信息、物联网传感信息、各种程序和APp的日志文件等。大数据所很多,主要包括数据采集、数据存储、数据管理、数据分析与挖掘4个环节。:在数据采集阶段主要使用的技术是数据抽取工具ETL:在数据存储环节主要有结构化数据、非结构化数据和半结构化数据的存储与访问。结构化数据一般存放在关系数据库,通过数据查询语言(SQL)来访问;非结构化(如图片、视频、doc文件等)和半结构化数据—般通过分布式文件系统的NoSQL(NotOnlySQL)进行存储。

2024-05-20 14:10:35 762

原创 2.4 计算机网络技术

(3)服务器为了保证足够的安全性,还采用了大量普通电脑没有的技术,如冗余技术、系统备份、在线诊断技术、故障预报警技术、内存纠错技术、热插拔技术和远程诊断技术等,使绝大多数故障能够在不停机的情况下得到及时的修复,具有极强的可管理性(manageability):根据网络规模的大小、网络用户的数量,来选择对外连接通道的带宽。(2)从无线网络的应用角度看,还可以划分出无线传感器网络、无线Mesh网络、无线穿戴网络、无线体域网等,这些网络一般是基于已有的无线网络技术,针对具体的应用而构建的无线网络。

2024-05-16 16:06:17 380

原创 2.3 应用集成技术

Web服务(WebServices)定义了一种松散的、粗粒度的分布计算模式,使用标准的 HTTP(S)协议传送 XML 表示及封装的内容。Web服务的主要目标是跨平台的互操作性,适合使用WebServices的情况包括:跨越防火墙、应用程序集成、B2B集成、软件重用等。同时,在某些情况下,Web服务也可能会降低应用程序的性能。不适合使用Web服务的情况包括:单机应用程序、局域网上的同构应用程序等。

2024-05-14 15:08:15 901

原创 2.2 面向对象系统分析与设计

统一建模语言(Unified Modeling Language UML)

2024-05-14 14:33:07 422

原创 数据库-分布式数据库与集中式数据库

而Oracle集群(如RAC)则更像是一个大包子。当你增加主机(馅)时,实际上是增加了这个大包子内部的填充物,使其更加饱满和丰富。然而,整个包子(集群)仍然是一个整体,其处理和存储能力是基于整个系统的,而不是基于单个部分的。当你需要增加处理能力或存储容量时,你可以简单地增加更多的小笼包(节点),这样整个系统的能力就会得到提升。分布式数据库通过增加节点来实现真正的分布式处理和存储,而Oracle集群则是通过增加主机来提高整个系统的处理和存储能力,但仍然保持其作为一个整体的特性。

2024-05-14 09:53:25 315

原创 2.1 软件工程

软件需求是针对待解决问题的特性的描述所定义的需求必须可以被验证在资源有限时,可以通过优先级对需求进行权衡通过需求分析,可以检测和解决需求之间的冲突、发现系统的边界、并详细描述出系统需求。

2024-05-13 15:38:29 1200

原创 1.4 IT战略

IT战略,是在诊断和评估企业信息化现状的基础上,制定和调整企业信息化的指导纲领,争取企业以最合适的成本,去做最合适的信息化工作。

2024-05-12 21:04:01 226

原创 机器学习-如何为模型选择评估指标?

例如,在医疗诊断中,误报(假阳性)可能是一个严重的问题,因此精确率可能是一个重要的指标。而在欺诈检测中,漏报(假阴性)可能更为严重,因此召回率可能更重要。有时,单一指标可能无法全面评估模型的性能。例如,在分类问题中,可以同时考虑精确率、召回率和F1分数等指标。当数据集存在类别不平衡的情况时,准确率可能不是一个好的评估指标,因为它可能会被多数类所主导。在这种情况下,使用精确率、召回率和F1分数可能更为合适。为机器学习模型选择评估指标是一个关键步骤,因为它直接关联到如何衡量模型的性能。

2024-05-10 22:53:27 241

原创 1.3 信息系统

是一种以处理信息为目的的专门的系统类型。信息系统可以是手工的,也可以是计算机化的。信息系统包括:硬件、软件、数据库、网络、存储设备、感知设备、外设、等。人类是最主要的因素。信息系统集成,采用现代管理理论(如软件工程、项目管理等)作为计划、设计、控制的方法论,将硬件、软件、数据库、网络等部件按照规划的结构和秩序,有机的整合到一个有清晰边界的信息系统中,以达到既定系统的目标,这个过程称为信息系统集成。

2024-05-10 22:46:16 278

原创 1.2 信息化

信息化是推动经济社会发展转型的一个历史性过程。在这个过程中,综合利用各种信息技术,改造、支撑人类的各项 政治、经济、社会活动,并把贯穿于这些活动中的各种数据有效、可靠地进行管理,经过符合业务需求的数据处理,形成信息资源,通过信息资源的整合、融合,促进信息交流和知识共享,形成新的的经济形态,提高经济增长质量。

2024-05-09 15:27:29 422

原创 1.1 信息的定义和属性

控制论创始人维纳认为:信息就是信息,既不是物质也不是能量。信息论的奠基者香农认为:信息就是能够用来消除不确定性的东西。其他流行说法:信息是事先不知道的报导。哲学界认为:信息是事物普遍联系的方式。事物的本体论信息,就是事物的运动状态和状态变化方式的自我表述。按照这个定义,所谓得到了某个事物的本体论信息,就是知道了这个事物处在什么样的运动状态,以及这个运动状态会按照什么方式发生变化。

2024-05-09 10:59:58 544

原创 机器学习-什么是 k-means?

k-means是一种无监督的分类学习算法。它的基本原理是以距离作为相似度的评价指标,用样本点到类别中心的误差平方和作为聚类好坏的评价指标,通过迭代的方法使总体分类的误差评分和函数达到最小的聚类方法。

2024-04-29 19:18:23 1162

原创 机器学习-什么是 PCA?

一般来说,你可以根据数据的特征、模型的复杂度、以及计算资源的限制来决定。另外,你还可以设定n_components=‘mle’,这样PCA会自动选取特征个数,使得满足所要求的方差百分比。它工作的原理是通过投影的方式,将高维数据映射到低维的空间中,并尽量保证投影后的数据保留了原始数据的主要特性。通过降低数据的维度,PCA不仅可以帮助我们简化模型,还能提高算法的运行效率,减少过拟合的风险。而LDA是一种监督式学习方法,既可以用于降维,也可以进行预测应用,既可以组合其他模型一起使用,也可以独立使用。

2024-04-29 19:13:44 723

原创 机器学习-异方差性是什么,如何克服异方差性?

异方差性(Heteroscedasticity)是指在回归模型中,随着自变量的变化,误差项的方差不是恒定的情况。简单来说,异方差性表示了随着自变量取值的不同,误差项的方差存在变化。

2024-04-23 15:29:04 1259

原创 机器学习-多重共线性是什么 ? 如何解决多重共线性问题 ?

多重共线性是指在回归模型中,自变量之间存在高度线性相关或近似线性相关的情况。

2024-04-23 15:26:30 759

原创 机器学习-线性回归普通最小二乘法运用的经典基本假设有哪些?

在实践中,对于这些基本假设的满足程度需要进行检验和验证。例如,可以通过残差分析来检验误差项的同方差性和正态性,利用相关系数或方差膨胀因子来检验自变量之间的共线性,以及使用F检验或t检验来检验回归系数的显著性。如果基本假设不满足,可能需要采取相应的方法来处理,例如应用异方差性修正方法或采用非线性回归模型。在实际应用中,研究者需要谨慎地评估和解释OLS估计结果,并考虑模型的适用性和假设的合理性。在线性回归中,普通最小二乘法(Ordinary Least Squares,OLS)是一种常用的参数估计方法。

2024-04-23 15:23:27 500

原创 CentOS-7部署mysql、clickhouse并通过普罗米修斯、grafna监控告警

访问http://192.168.15.129:9090/targets,看到clickhouse状态是up。访问http://192.168.15.129:9090/targets,看到up说明启动成功。访问http://192.168.15.134:9104/metrics成功。所用镜像:CentOS-7-x86_64-DVD-2009.iso。

2024-04-23 15:18:15 1407 1

原创 CentOS-7安装grafana

因为在测试,直接iptables -F。

2024-04-23 15:01:09 982

原创 CentOS-7安装clickhouse并允许其他主机登录

修改把 :: 的注释打开,这样的话才能让ClickHouse被除本机以外的服务器访问。访问 https://packages.clickhouse.com/rpm/stable/ 下载文件。

2024-04-23 14:52:06 645 1

原创 CentOS-7安装Mysql并允许其他主机登录

【代码】CentOS-7安装Mysql并允许其他主机登录。

2024-04-23 14:40:27 208

原创 统计学-一类错误和二类错误哪个个严重?

在其他情况下,二类错误可能更为严重,因为它可能导致错失重要的发现和进展,使我们无法获得有价值的信息。在某些情况下,二类错误可能带来严重的后果,例如在医学领域中,未能发现一种有效的治疗方法可能导致患者无法获得适当的治疗。在某些情况下,一类错误可能带来严重的后果,例如在医学领域中,错误地认为一种治疗方法有效可能导致患者接受不必要的治疗或药物副作用。因此,研究者需要根据具体情况和研究目的,综合考虑一类错误和二类错误的风险,并选择适当的显著性水平和样本大小,以在可接受的错误范围内最大限度地减少两种错误的概率。

2024-04-22 12:34:26 686

原创 统计学-什么是一类错误和二类错误?

一类错误和二类错误是一对相互关联的错误。在假设检验中,我们希望通过控制显著性水平(α)来减少一类错误的可能性,同时降低二类错误的概率。一类错误(Type I error):如果我们设置了显著性水平(α)为0.05,这意味着我们愿意接受5%的风险来犯一类错误。假设实际上该药物对血压没有影响(H0为真),但由于样本误差或其他因素,我们错误地拒绝了原假设,即错误地认为该药物可以降低血压。二类错误(Type II error):与一类错误相反,假设实际上备择假设为真(H1为真),即该药物可以降低血压。

2024-04-22 12:31:44 1319

原创 统计学-什么是 p 值?

需要注意的是,p值并不能告诉我们假设的真实性或效应的大小。p值告诉我们,如果原假设为真,观察到的数据或更极端数据出现的概率是多少。p值的范围在0到1之间。一个小的p值(通常小于0.05)表示在原假设下,观察到的数据或更极端数据出现的概率非常低。p值(p-value)是统计学中的一个概率值,用于评估观察到的数据与一个假设之间的一致性。更具体地说,它表示在假设为真的情况下,观察到的统计量或更极端情况出现的概率。相反,一个大的p值(通常大于0.05)表示在原假设下,观察到的数据或更极端数据出现的概率相对较高。

2024-04-22 12:27:00 988

原创 统计学-F检验的用途有哪些?

F检验是一种常用的统计检验方法,主要用于以下几个方面:

2024-04-22 12:24:27 719

原创 统计学-什么是单因素方差分析?

单因素方差分析(One-Way Analysis of Variance,简称ANOVA)是一种统计方法,用于比较三个或更多个组(或处理)之间的平均数是否存在显著差异。在单因素方差分析中,研究者将观察值按照一个特定的因素进行分类,并比较不同类别之间的平均数是否存在显著差异。这个因素可以是任何可以将观察值分成两个或更多组的变量,例如不同的治疗方法不同的药物剂量等。这个方法的基本假设是,各个小组的成绩都是从同一个大家庭(也就是说,同一个总体)出来的,只是由于一些小问题导致了一些差异。

2024-04-22 12:20:41 279

原创 统计学-为什么t检验需要进行方差齐次性检验?

如果方差不齐,那么使用常规的t检验(即假设方差相等的t检验)可能会导致第一类错误(即错误地拒绝零假设)的概率增加,从而降低统计推断的有效性。如果方差齐次性检验的结果显示两个样本的方差确实不相等,那么应该使用不假设方差相等的t检验(如Welch的t检验)或其他非参数检验方法,以确保统计推断的准确性和可靠性。t检验是建立在两个样本分别来自具有相同方差的正态分布总体的假设之上的。如果两个总体的方差不相等(即方差不齐),那么t检验的结果可能不准确,甚至可能导致错误的结论。

2024-04-19 16:12:57 618

原创 【八 (2)指标体系建设-故障指标体系建设步骤】

ODS的数据特点包括不断更新和易丢失,不存储历史数据,只反映当前实时性的信息,并且存储细节性数据,很少有汇总数据。ODS的主要功能包括作为业务系统和数据仓库之间的隔离地带、降低业务系统的压力、满足从微观角度查询细节数据的要求、实时性的数据整合功能、检查数据质量的功能,以及为企业提供统一的数据视图和数据共享的功能。同时,由于DWD层存储的是最原始的数据,因此数据质量较高,能够保证数据的完整性和准确性。在设计过程中,应遵循最小化原则,合理划分数据域和维度,减少不必要的字段和关系,提高数据的可读性和可维护性。

2024-04-19 16:08:02 618

原创 统计学-什么是 T 检验和 Z 检验?

t检验,也称为student t检验,主要用于样本含量较小(例如n < 30),总体标准差未知,且数据服从正态分布的情境。它通过计算样本均值之间的差异以及这种差异相对于样本误差的大小来判断差异是否显著。z检验利用数据的z分数符合正态分布的性质来推断差异发生的概率。它的检验统计量是通过计算样本均值与总体均值之间的差异,并除以标准误差得到的。然后,利用给定的显著性水平和z值查找标准正态分布表,从而确定差异是否显著。t检验和z检验都是常用的统计推断方法,用于检验两个样本均值之间是否存在显著差异。

2024-04-16 11:35:58 565

原创 统计学-假设检验和置信区间的关系是什么?

假设检验是一种统计推断方法,其基本原理是“小概率事件”原理,通过反证法来判断样本与样本、样本与总体之间的差异是由抽样误差引起还是本质差别造成的。其次,置信区间可以提供假设检验无法提供的信息,比如根据置信区间的上下限数值大小,我们可以判断差异是否具有实际意义。此外,假设检验可以提供确切的P值,而置信区间只能在预先确定的置信度水平上进行推断,没有精确的概率值。首先,置信区间具有假设检验的主要功能,即在特定的显著性水平(α水准)上,可以判断样本数据之间的差异是否具有统计学意义。

2024-04-16 11:34:03 698

原创 统计学-中心极限定理和置信区间的关系是什么?

具体来说,在研究和评估中,置信度是衡量数据或结果的可靠性和可信度的一种指标,它反映了被评估对象的真实性或有效性。例如,在机器学习和人工智能中,置信度是指算法对某个预测结果的置信程度或可信程度;在统计学和概率论中,置信度是对某个样本统计量所构造的总体参数估计区间的可信程度或把握程度的度量。置信度通常表示为一定范围内的百分数,比如95%的置信度意味着我们有95%的信心认为某个结果是准确的。总的来说,置信度是统计和决策制定中的一个关键概念,它帮助我们在不确定性中做出更明智的判断和决策。

2024-04-16 11:30:41 442

原创 统计学-什么是置信度 ?

具体来说,在研究和评估中,置信度是衡量数据或结果的可靠性和可信度的一种指标,它反映了被评估对象的真实性或有效性。例如,在机器学习和人工智能中,置信度是指算法对某个预测结果的置信程度或可信程度;在统计学和概率论中,置信度是对某个样本统计量所构造的总体参数估计区间的可信程度或把握程度的度量。置信度通常表示为一定范围内的百分数,比如95%的置信度意味着我们有95%的信心认为某个结果是准确的。总的来说,置信度是统计和决策制定中的一个关键概念,它帮助我们在不确定性中做出更明智的判断和决策。

2024-04-16 11:27:58 1719

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除