学习
文章平均质量分 70
凭轩听雨199407
这个作者很懒,什么都没留下…
展开
-
【工业智能】VSB Power Line Fault Detection-chapter1
每个信号包含80万个电线电压测量值,测量超过20ms。由于底层电网以50Hz运行,这意味着每个信号都覆盖一个完整的电网周期。电网本身是三相供电的,所有测量值都是三相同时测量的。id_measurement: 同时记录三个信号为一组的ID代码signal_id: 信号数据的外键。每个信号id在训练集和测试集中都是唯一的。因此训练集中的第一个id是0,测试集中的第一个id是8712phase:三个一组的信号的相位ID代码。这个相位可能或者可能不是受线路上的故障影响。原创 2024-01-11 16:13:14 · 990 阅读 · 0 评论 -
【资源占用】 CPU GPU
程序对服务器资源的占用情况原创 2022-11-07 21:51:27 · 629 阅读 · 0 评论 -
【regression】分位数回归 quantile regression
回归出一个范围,可以使用分位数回归。原创 2022-11-01 14:30:03 · 1306 阅读 · 0 评论 -
【EDA】常用函数
仅供自己EDA用原创 2022-08-18 15:07:56 · 275 阅读 · 0 评论 -
求职准备知识点
一、PLR:时间序列中特征提取的方法, 将其总结为四大类, 它们分别是基于基本统计方法的特征提取、基于模型的特征提取、基于变换的特征提取、基于分形维数的特征提取。时间序列表示方法包括PAA(分段聚合近似),PLR(分段线性表示),SAX(符号化聚合近似),基于模型的表示方法,以及基于变换的表示方法等。四、全局算法1、自顶向下TD算法:时间序列的开始点和结束点,是首先选中的分段点。然后,遍历两点之间的所有点,找出和这两点连成的直线距离最大的点,如果这个点到直线的距离“大于”预先给定的阀值,我们将其称原创 2021-11-25 09:51:52 · 847 阅读 · 3 评论 -
2021-09-19 集成学习TASK2
TASK2 回归问题作业:1、请详细描述线性回归模型的最小二乘法表达。回答:一元线性回归的基本假设:1)对模型和变量的假定:假设解释变量X是非随机的。假设变量和模型无设定误差。2)对随机误差项的假定:零均值假定同方差假定...原创 2021-09-19 22:58:39 · 348 阅读 · 0 评论 -
2021-09-16 集成学习上--task1机器学习数学基础
task1机器学习数学基础作业:试编写程序完成下述工作:1) 为不同的a,b取值,绘制该函数的3D表面。请问 a,b取值对该表面形状有大的影响吗?,所谓大影响就是形状不再相似。2) 编写一个算法来找到它的全局最小值及相应的最小解,并在3D图中标出。分析一下你的算法时空效率、给出运行时间。1)a/b分别取值-2到2,图形如下:a/b分别取值-1到1,图形如下:形状分类:b<0:b>=0:2)用梯度下降法求解最小值f(x) = (a - x1)2 + b(x2 -原创 2021-09-16 21:22:09 · 111 阅读 · 0 评论 -
2021-08-10centos7安装python3,pyinstaller
关键词:vmware centos7 python3 pyinstaller概述:由于公司的一些信息安全政策限制。故需要在虚拟机中创建centos7系统,再安装python3,实现python项目的工程化打包。基本参数:私服:ubuntu18虚拟机借助软件vmware虚拟机中的系统:centOS7虚拟机中安装的python3.6步骤:1.在ubuntu中安装vmware2.在vmware中安装centOS7系统3.在centOS7中安装python34.在python3后安装pyi原创 2021-08-10 18:21:30 · 495 阅读 · 0 评论 -
2021-07-22java编程组队学习202107task5
Java TASK5面向对象核心技术抽象类与接口抽象类继承抽象类和调用接口异常处理抽象类与接口抽象类抽象类是所有子类属性的集合。抽象类不能实例化对象。只有被继承了以后才能被使用。定义抽象类:Modifies abstract class name{}抽象方法:abstract void method();只有抽象类才可以包含抽象方法,class B extends abstract-class A,则classB必须重写classA的抽象方法,或声明自己是abstract class。原创 2021-07-22 19:25:32 · 147 阅读 · 1 评论 -
2021-07-19-Java编程-T4
Java组队学习T41.类与方法1.类与方法原创 2021-07-19 19:46:42 · 209 阅读 · 2 评论 -
python apscheduler
1.references:apscheduler理论2.intervalscheduler.add_job(func=ma,trigger=‘interval’,minutes=1)scheduler.add_job(func=ma,trigger=‘interval’,seconds=2)3.cron定时原创 2021-07-19 10:20:08 · 81 阅读 · 0 评论 -
influxDB运维记录
7月14日发现influxDB没有数据了排查下来发现是写入失败了。主要是influx设置生效的保存策略和驱动程序里的不一致:另外,在将原来默认的autogen(不设限制)保存策略删除的情况下,发现服务器内存由97%一下子降到了65%!(虽然今天看,内存又上涨到了87%)autogen的保存策略是把数据维护在内存的,所以导致内存很高。influxDB插入快,查询较慢,是因为:底层用的红黑树,左右旋转少,只要维护树的相对平衡,保证每个节点在子节点的黑球数相等。写性能高的一般是时序数据库,读性原创 2021-07-16 11:30:14 · 1080 阅读 · 0 评论 -
2021-07-16JAVA编程202107组队学习task3
JAVA编程task3数组一维数组二维数组多维数组数据遍历一维数组数组是一组连续的存储空间,数组相当于一个容器,类型相同,长度固定。数组的创建:元素类型[] 数组名 = new 元素类型[元素个数或数组长度];注意:int x[] 也是一种创建数组的格式。推荐使用int[ ] x 的形式声明数组。数组初始化:数组内存分析:栈内存:栈内存存储的都是局部变量堆内存:堆内存存储的都是对象内存二维数组二维数据的两种声明方式:int arr1[][];char[][] arr2;原创 2021-07-16 11:05:17 · 98 阅读 · 0 评论 -
JAVA编程202107组队学习task2
JAVA编程task2运算符和表达式数学函数与常量控制流程运算符和表达式算数运算符描述+加-减*乘/除%求余数数学函数与常量控制流程原创 2021-07-15 20:00:42 · 101 阅读 · 0 评论 -
JAVA编程202107组队学习
JAVA编程task10.Java简介与安装配置简介1.基本数据类型与变量0.Java简介与安装配置简介Java是基于C++编写的。Java开发商:美国Oracle。Java特点:简单性面向对象分布式健壮性安全性平台独立与可移植性多线程动态性Java可以编写:桌面应用程序Web应用程序分布式系统嵌入式系统应用程序Java编程工具:eclipsenet beansintelliJ IDEAmy eclipseedit plus需要了解的几个缩略词:原创 2021-07-13 13:55:22 · 120 阅读 · 0 评论 -
ubuntu jidea
1.JDK安装,设置环境变量:https://www.cnblogs.com/luoli-/p/9247952.html2.Ubuntu安装intellIJ IDEAhttps://blog.csdn.net/qq_41170600/article/details/104785845原创 2021-05-24 11:26:45 · 124 阅读 · 0 评论 -
2021-04-23docker综合实践
task6 docker综合实践挂载部署构建镜像部署学习目的:通过docker将个人项目修改为容器化部署的形式,实现CI/CD功能。CI/CD:持续集成Continuous Integration持续交付continuous delivery工厂里的装配线以快速、自动化、可重复的方式从原材料生产出消费品。同样,软件交付管道以快速、自动化和可重复的方式从源代码生成发布版本。如何完成这项工作的总体设计称为“持续交付”(CD)。启动装配线的过程称为“持续集成”(CI)。挂载部署1.jar包上传到服原创 2021-04-23 16:32:11 · 109 阅读 · 0 评论 -
2021-04-21docker compose
task5 docker composedocker-compose安装docker-compose安装os:ubuntucommand:sudo apt install docker-compose安装完成后,可以查看版本:docker-compose --version原创 2021-04-21 08:41:26 · 141 阅读 · 0 评论 -
2021-04-19docker网络
task4 docker网络1.外部访问docker容器互联docker 基础网络1.外部访问docker1.1 docker container ls查看主机和容器端口映射情况$ docker container ls CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS N原创 2021-04-19 17:09:48 · 111 阅读 · 0 评论 -
2021-04-17docker task3数据管理
task3数据管理数据卷1.定义:2.特性:3.挂载4.命令数据卷1.定义:是一个可供一个或多个容器使用的特殊目录2.特性:1)数据卷可以在dockers之间共享和重用2) 对数据卷的修改会立马生效3) 更新数据卷不影响镜像4)数据卷一直存在,即使dockers被删除3.挂载数据卷类似Linux下对目录或文件mount。也就是挂载文件到目录。关于挂载、挂载点:Linux中的根目录以外的文件要想被访问,需要将其“关联”到根目录下的某个目录来实现,这种关联操作就是“挂载”,这个目录就是原创 2021-04-17 14:55:48 · 65 阅读 · 0 评论 -
2021-04-13docker镜像与容器
2021-04-13docker镜像与容器TASK2docker三个重要概念:镜像image仓库registries容器containerdocker容器引擎容器:应用以及依赖的环境的集合,能够被docker引擎执行。如:JDK,TOMCAT,MYSQL,MQ,CENTOS镜像:把容器封装为一个镜像;镜像可以实例化多个容器。镜像:Class Dog0容器:Dog d = new Dog0:容器:Dog c = new Dog0:仓库:存放镜像的地方,dockerhub, http原创 2021-04-13 13:20:12 · 200 阅读 · 0 评论 -
2021-04-12docker简介与安装
2021-04-12docker简介与安装TASK1Introduction1.1学习docker前的准备:1.2docker是什么Introduction1.1学习docker前的准备:1)准备一个Linux操作系统;如果没有Linux,安装虚拟机,在虚拟机中安装Linux;2)掌握Linux操作系统的基本命令。3)git / svn工具的思维。对于docker技术而言:JAVA开发者:能够快速搭建开发环境。运维人员: 能够快速搭建测试、运行、部署环境。1.2docker是什么d原创 2021-04-12 21:42:05 · 176 阅读 · 1 评论 -
2021-03-28零基础入门数据挖掘-心跳信号分类预测
心跳信号分类预测TASK051.基本理论Task 5: 模型融合1.基本理论模型融合有三大类方式:简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);分类:投票(Voting)综合:排序融合(Rank averaging),log融合stacking/blending:构建多层模型,并利用预测结果再拟合预测。boosting/bagging(在xgboost,Adaboost,GBDT中已经用到):多原创 2021-03-28 20:01:22 · 571 阅读 · 1 评论 -
2021-03-25零基础入门数据挖掘-心跳信号分类预测
心跳信号分类预测TASK041.理论基础TASK04模型调参1.理论基础1.1逻辑回归模型1.2树模型1.3集成模型1.3.1基于bagging思想的集成模型随机森林模型随机树模型1.3.2基于boosting思想的集成模型XGBOOSTLIGHTGBMCATBOOSTAdaboostGBDT1.3.3基于stacking思想的集成模型1.4模型对比与性能评估1.5模型调参1.5.1贪心调参方法1.5.2网格调参方法1.5.3贝叶斯调参方法...原创 2021-03-25 18:14:03 · 500 阅读 · 2 评论 -
2021-03-22零基础入门数据挖掘-心跳信号分类预测
心跳信号分类预测TASK03一、理论基础1.学习目标2.学习内容3.主要函数介绍4.时间序列预测方法介绍二、代码实现TASK03 特征工程一、理论基础1.学习目标学习时间序列数据的特征预处理方法学习时间序列特征处理工具 Tsfresh(TimeSeries Fresh)的使用2.学习内容数据预处理– 时间序列数据格式处理– 加入时间步特征time特征工程– 时间序列特征构造– 特征筛选– 使用 tsfresh 进行时间序列特征处理3.主要函数介绍3.1Tsfresh原创 2021-03-22 14:43:05 · 1470 阅读 · 3 评论 -
2021-03-17零基础入门数据挖掘-心跳信号分类预测
零基础入门数据挖掘-心跳信号分类预测TASK021.学习目标:2.学习内容2.1载入库2.2载入数据2.3数据总览2.4数据缺失和异常2.5预测值分布1.学习目标:数据探索性分析EDA为什么要做EDA:了解数据集了解变量间的相互关系、变量与预测值之间的存在关系引导数据处理以及特征工程2.学习内容2.1载入库载入各种数据科学以及可视化库:数据科学库 pandas、numpy、scipy;可视化库 matplotlib、seabon;import warningswarnings.原创 2021-03-17 17:05:33 · 600 阅读 · 6 评论 -
2021-03-15零基础入门数据挖掘-心跳信号分类预测
零基础入门数据挖掘-心跳信号分类预测一、赛题理解1.赛题理解2.赛题数据3.评分标准二、baseline学习一、赛题理解1.赛题理解本次赛题需根据 心电图感应数据 预测 心跳信号所属类别。是一个多分类问题:正常心律不齐心肌梗塞2.赛题数据字段表:fielddescriptionid为心跳信号分配的唯一标识heartbeat_signals心跳信号序列label心跳信号类别(0\1\2\3)3.评分标准共有4种不同的心跳信号。预测的概率与原创 2021-03-15 13:34:26 · 1269 阅读 · 13 评论 -
2021-02-21AI助力精准气象和海洋预测
AI助力精准气象和海洋预测TASK01比赛全流程体验docker学习定义Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中,然后发布到任何流行的 Linux或Windows 机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口。Docker通常用于如下场景:web应用的自动化打包和发布;自动化测试和持续集成、发布;在服务型环境中部署和调整数据库或其他的后台应用;从头编译或者扩展现有的OpenShift或Cloud Foun原创 2021-02-21 18:36:34 · 322 阅读 · 1 评论 -
2021-01-24高维异常
异常检测feature baggingisolation forestsTASK05高维异常feature baggingisolation forests原创 2021-01-24 22:43:46 · 157 阅读 · 0 评论 -
2021-01-21基于相似度的方法
异常检测基于距离的度量基于单元的方法基于索引的方法基于密度的度量密度聚类局部离群因子TASK04:基于相似度的方法基于距离的度量基于单元的方法基于索引的方法基于密度的度量密度聚类局部离群因子...原创 2021-01-21 23:16:20 · 102 阅读 · 0 评论 -
2020-01-18线性模型
异常检测TASK3回归建模:参数化的相关性分析线性回归:通过其他变量预测单独的属性值主成分分析:用一些潜在变量来代表整个数据重要假设:近似线性相关子空间假设原创 2021-01-18 13:15:58 · 107 阅读 · 2 评论 -
2021-01-14基于统计学的方法
异常检测Task2:基于统计学的方法根据如何指定和学习模型,异常检测的统计学方法可以划分为两个主要类型:参数方法和非参数方法。原创 2021-01-14 23:14:18 · 394 阅读 · 0 评论 -
2021-01-12异常检测概述
异常检测什么是异常检测异常的分类异常检测任务分类TASK01什么是异常检测异常的分类点异常上下文异常群体异常异常检测任务分类有监督无监督半监督原创 2021-01-12 22:19:05 · 158 阅读 · 0 评论 -
2020-11-30numpy下学习
TASK05大作业1数据集:鸢尾属植物数据集包括了三类不同的鸢尾属植物:Iris Setosa,Iris Versicolour,Iris Virginica。每类收集了50个样本。sepallength:萼片长度sepalwidth:萼片宽度petallength:花瓣长度petalwidth:花瓣宽度以上四个特征的单位都是厘米(cm)。1导入鸢尾属植物数据集,保持文本不变。...原创 2020-11-30 17:50:13 · 178 阅读 · 1 评论 -
2020-11-29numpy学习
线性代数NumPy 中同时存在 ndarray 和 matrix 对象,官方并不推荐在程序中使用 matrix。以下介绍ndarray。原创 2020-11-29 21:32:49 · 206 阅读 · 0 评论 -
2020-11-27numpy学习
tongji原创 2020-11-27 19:15:16 · 128 阅读 · 0 评论 -
2020-11-25numpy学习
随机抽样离散型随机变量二项分布泊松分布超几何分布连续型随机变量均匀分布正态分布指数分布其他随机函数np.random.seed()随机数种子,功能:每次生成的随机数因时间差异而不同。为什么需要seed:在数据预处理中,如果有随机操作,最好制定一个随机数种子,避免随机数据对结果造成影响。随机变量分为离散型和连续型。离散型随机变量二项分布泊松分布超几何分布连续型随机变量均匀分布正态分布指数分布其他随机函数...原创 2020-11-25 19:32:51 · 154 阅读 · 0 评论 -
2020-11-23numpy学习
numpy输入与输出二进制二进制二进制文件类型:npy/npznpy默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为.npy的文件中。code: import numpy as np a = np.arange(5) np.save('test.npy',a) b = np.load('test.npy') print(b)输出:[0 1 2 3 4]npz以压缩打包的方式存储文件,可以用压缩软件解压。多个数组保存到一个文件中的话,可以使用numpy.sa原创 2020-11-23 15:46:44 · 376 阅读 · 2 评论 -
2020-09-26数据挖掘实践-金融风控
金融风控-TASK05模型融合内容stacking\blending学习目标:将之前建模调参的结果进行模型融合。内容以下是模型融合的方式:平均:简单平均法加权平均法投票:简单投票法加权投票法综合:排序融合log融合stacking:构建多层模型,并利用预测结果再拟合预测。blending:选取部分数据预测训练得到预测结果作为新特征,带入剩下的数据中预测。boosting/baggingstacking\blending...原创 2020-09-26 15:51:49 · 139 阅读 · 0 评论 -
2020-09-23数据挖掘实践-金融风控
数据挖掘实践-金融风控TASK04建模与调参学习目标TASK04建模与调参学习目标原创 2020-09-23 09:18:26 · 180 阅读 · 0 评论