旺旺丫丫-CSDN博客

原创汽车专业名词

ABS制动防抱死系统（antilock brake system）链接：防抱死制动系统_百度百科EBD（Electronic Brake-Force Distribution）EBD是电子制动力分配，实际上EBD是ABS的辅助功能，配置有EBD系统的车辆，会自动侦测各个车轮与地面间的附着力状况，将刹车系统所产生的力量，适当地分配至四个车轮，在EBD系统的辅助之下，制动力可以得到有效的控制，使得制动距离明显地缩短，并在制动的时候保持车辆的平稳，提高行车的安全。EBD的功能就是在汽车制动的瞬间，

2022-07-23 21:46:27 799

原创专业名词（ADAS）

LDW车道偏离预警(LDW)旨在帮助驾驶员在高速公路、快速道路等类似主干道上降低车辆意外偏离车道的风险，车道偏离预警(LDW)将通过视觉、听觉和触觉的方式警告驾驶员。链接：LDW车道偏离预警系统_什么是LDW车道偏离预警系统_太平洋汽车网百科车道偏离报警(ldw)系统技术简介ADAS算法设计（三）：LDW算法设计、FCW前碰撞预警，全称Forward Collision Warning，简称FCW。它通过视觉摄像头或雷达系统监测车辆与前车距离及相对时速，对

2022-05-05 00:11:03 5031

原创半导体公司

MOTOROAL(美国莫托罗拉半导体产品公司) http://www.motorola.com/　 PHILIPS(荷兰菲利浦公司) http://www.semiconductors.philips.com/　 FAIRCHILD(美国仙童公司) http://www.fairchildsemi.com/　 SANKEN(日本三肯电子公司) http://ww...

2020-03-21 16:37:36 458

原创 makefile知识点整理

.PHONYPHONY 目标名称这里的目标名称不是真实的文件名称，作为执行命令显示的名称。= := ?= +== 是最基本的赋值:= 是覆盖之前的值?= 是如果没有被赋值过就赋予等号后面的值+= 是添加等号后面的值...

2019-12-03 14:21:34 233

原创 Redis代码剖析（1）

Redis代码剖析（1）ACLAEaeCreateEventLoop 创建事件循环aeCreateTimeEvent 创建时间事件aeSearchNearestTimer查找最近一个时间事件processTimeEvents循环执行时间事件aeMain event处理主循环事件处理apiACLACL 访问控制列表（Access Control List）AE事件驱动的程序库。aeCrea...

2019-12-02 17:14:48 206

原创数据挖掘-支持度

在数据挖掘的关联分析中，支持度和置信度会同时分析。支持度和置信度总是伴随关联规则存在的，他们是对关联规则的必要的补充。A->B（support=30%，confidence=60%）支持度是说A和B同时发生的概率。P(AB)=30置信度是说在A发生的条件下，B发生的概率。P(B|A)=60% ...

2018-12-11 16:55:08 1749

原创机器学习-感知机模型（pocket算法）实现

我们上一篇考虑的感知机模型有一个假定：数据是线性可分的。实际上，由于噪音或者其他因素的存在，不能都是线性可分的。所以，需要考虑非线性可分的情况下，实现方法。这里使用Pocket算法：Pocket算法的思想非常简单，在搜索W的时候，不断记录最好的准确率和W。这样即使数据不是线性可分的，也可以得到比较好的测试结果（只要不断的提高迭代的次数）数据：https://www.csie.ntu...

2018-11-22 18:29:08 1925

原创机器学习-线性感知机模型

把断断续续学习的机器学习方面的东西整理一下，还是需要系统的记录一下。线性预测定义下面的的函数Ld是一个函数集合，W是d维度的参数，b是定义在R的标量。所以整个函数就是标量。当Y的值域是{-1,1}的时候，半空间可以定义为：在于W垂直的超平面上面的部分，数据被标记为正类，当在超平面的下面的话，数据被标记为负类。=>两边同时乘以因为sign(&l...

2018-11-20 16:36:45 346

原创 hyperledger fabric环境构建

1.ubuntu 16.04LTS准备（通过虚拟机安装）2.升级docker首先需要更新源，之前使用163和阿里的，发现总有更新不成功的源，所以改回官方源。vim /etc/apt/sources.listhttp://wiki.ubuntu.org.cn/%E6%A8%A1%E6%9D%BF:16.04sourceapt-get update --fix-missing更...

2018-11-02 16:39:25 475

原创机器学习-AUC/ROC

1.ROC接收者操作特征曲线（receiver operating characteristic curve，或者叫ROC曲线）ROC空间将伪阳性率（FPR）定义为 X 轴，真阳性率（TPR）定义为 Y 轴。TPR：在所有实际为阳性的样本中，被正确地判断为阳性之比率。FPR：在所有实际为阴性的样本中，被错误地判断为阳性之比率。给定一个二元分类模型和它的阈值，就能从所有样...

2018-10-12 00:46:05 803

原创主成分分析（PCA）

1.PCA的原理主成分分析PCA(principal component analysis)是一种降维的方法。在PCA中，数据集被从原来的坐标系统转换到一个新的坐标系统。坐标系的选择是有数据决定的，第一个坐标选择是原始数据中方差最大的方向，第二个坐标轴选择是跟第一个坐标轴正交，并且具有最大方差的方向。其他坐标轴的选择跟这个一样的做法。这样大部分方差大的坐标就在前几个坐标系里面了。2...

2018-10-10 10:03:38 322

原创特征选择-熵和互信息

1、熵一个离散型的随机变量X的熵H(X)定义为熵常用以2为底的对数，则熵的单位用比特(bit)进行表示。以e为底的对数，则熵的单位用nat表示熵可以看做是随机变量平均不确定度的度量。 2、互信息定义（mutual information）它是一个随机变量包含另一个随机变量信息的度量。考虑两个随机变量X和Y，它们的联合概率密度函数为p(x,y)，其边际概率密度函数...

2018-09-21 13:02:23 4421

原创特征选择-χ²检验

χ²检验用来检验两个事件的独立性。如果A，B两个事件是独立的，则概率P(AB)=P(A)P(B)。公式如下：其中：1）D是数据集2）t：term，即特征3）c：class，分类4）N：在数据集里面观测值的频率5）E：数学期望计算方法：0）前提假设：t与c是独立的1）首先计算t=xi，c=yi的观测值（观测数量/频率）Nx,y= xi出现并且yi出...

2018-09-21 10:42:52 2597

原创 mysql数据库导入导出命令

当数据库有json或者外键依赖的时候，通过navicat等工具导出有时候就会出现错误，因而还是需要通过命令行进行导入导出。备份一下命令：■数据导出mysqldump.exe -h localhost -u root -p --default-character-set=utf8 test >d:\datatable\test.sql■数据导入mysql -h local...

2018-09-21 09:37:04 241

原创特征选择-单变量特征选择

1.SelectKBest可以依据相关性对特征进行选择，保留k个评分最高的特征。①方差分析分类问题使用f_classif，回归问题使用f_regression。f_classif：分类任务跟目标的分类，将样本划分成n个子集，S1,S2,..,Sn，我们希望每个子集的均值μ1，μ2，...，μn不相等。我们假设H0:μ1=μ2=...=μn，当然我们希望拒绝H0,所以我们希望构造...

2018-09-20 22:53:52 6048

原创特征选择-方差分析

1.方差分析按照其性质分为两大类：固定处理(fixed treatment)和随机效应(random effect)。方差分析模型分为三类：1）固定模型方差分析(fixed model anova),或称为模型Ⅰ方差分析。2）随机模型方差分析（random model anova),又叫做模型Ⅱ方差分析。3）混合模型方差分析（mixed model anova),即模型Ⅲ方差分析。 ...

2018-09-20 15:58:34 7071

原创连续数据的离散化

1.分段类散同步pandas.cut对值进行分段划分，进行离散化。类散化后是分段的index。import pandas as pddata = [1,3,6,20,50,100]w =[0,10,50,100]v=5data_cut1 = pd.cut(data,w,labels=False)data_cut2=pd.cut(data,v,labels=False)print...

2018-09-19 00:42:05 2392

原创特征变换

1.One-Hot Encoding有多少个状态就用几个bit来进行表示，实际上是向量维度增加了。树形模型不进行One-Hot Encodingfrom sklearn.preprocessing import OneHotEncoderimport pandas as pddata = pd.DataFrame({'number': [1, 2, 1], 'age': [20, ...

2018-09-18 18:24:31 1019

原创特征放缩(Feature scaling)

特征放缩的几种方法1.Min-Max scaling min-max标准化该方法是最简单的数组放缩方法。处理类：from sklearn.preprocessing import MinMaxScaler2.均值归一化处理(Mean normalization)3.均值标准化Z-score standardization在很多机器算法中使用到，例如支持向量机，逻...

2018-09-18 15:39:54 659

原创 Z-Score含义

Z-Score定义为：其中X为观测值u是总体均值σ是总体均值可以通过z查询概率

2018-09-15 01:32:49 12976

原创 scikit-learn中分类算法选择的路径

2018-09-14 22:45:21 403 1

原创机器学习-箱线图（Box-and-Whisker Plots）

箱线图的构成：1.中位图代表分布的位置2.箱线（box）代表内部的上下4分位的宽度，可以作为分布的宽度3.上下边界：分布的上下尾部4.极端值

2018-08-23 16:26:04 12288

原创机器学习-统计学概要

1.平均值（mean）2.方差（variance）3.标准差（standard deviation）4.中位数（median）一组数据进行排序，如果是基数个数，则取中间的那个数据。如果是偶数个数据，则取中间两个数的平均值。5.分位数（quantiles）针对一组数据（n个数据）进行从小到大进行排序，p分为数为（1+n）*p位置上对应的数。6.百分位数（per...

2018-08-23 14:17:09 226

原创机器学习-累计分布函数（CDF）

1.累计分布函数（The Cumulative Distribution Function）:在x点左侧事件发生的总和。累计分布函数的特性：①因为累计分布函数是计算x点左侧的点的数量，所以累计分布函数CDF是单调递增的。②CDF比没有直方图变化剧烈，但是CDF包含了相同的信息，并且减少了噪声。。③由于CDF不存在装箱（分段），因此比直方图能更好的展现数据。④所有的CDF中，...

2018-08-23 12:04:35 61707 6

原创机器学习-直方图和核密度估计（Kernel Density Estimates）

1、直方图的问题①直方图装箱（binning）的过程会导致信息丢失。②直方图不是唯一的。对比起来比较困难。③直方图不是平滑的④直方图不能很好的处理极值核密度估计（KDE）完全没有上述的问题。构建KDE需要准备核函数：下面是常用的核函数图形和定义。构建一个KDE包含两部分：①把kernel偏移到特定的位置②设定带宽bindwidth下图是高斯k...

2018-08-22 19:17:38 10856

原创机器学习的数据准备

数据准备是机器学习的关键步骤。大致可以分为以下步骤：1.选择数据这一步骤是选择可分析的业务数据的一个子集。2.选择数据后就需要对数据进行预处理。包含以下内容：①格式化转换成需要的形式②清理删除或者修复部分缺失的数据。③采样可能选择的数据比模型运行的要的数据要多，可以从选择的数据中选取有代表性的数据进行使用。3.转换数据①放缩预处理后的数据可能...

2018-08-21 18:14:59 752

原创 PAC学习框架-模型定义

针对概念分类C，PAC可学习定义为：存在算法A和多项式 poly(.,.,.,.)对于任意的ε和δ（其中ε是最大错误率，δ是置信度），针对X上的任意分布D，针对任意的c∈C，针对任意的数量m>poly(1/ε,1/δ,n,size(c）)的学习集，以下概率都成立：则如果A运行在poly(1/ε,1/δ,n,size(c）)中，则称C是可以PAC学习的。如果算法A存在，则称A是...

2018-08-21 11:13:32 3091

原创 PAC学习框架-经验误差

假设h∈H，目标concept c∈C，并且在训练集上S=(x1,..,xm)，经验误差被定义为：经验误差实际上是在学习集上的误差。在i.i.d的情况下，数据量理想的情况下，经验误差的数学期望等于实际误差。...

2018-08-21 10:23:35 384

原创 PAC学习框架-泛化误差

术语：independently and identically distributed (i.i.d.) 独立同分布The notation x∼D simply states that the sample x came from the specific distribution that was noted as D.定义理解 1.泛化误差（Generalization e...

2018-08-21 01:19:28 714

原创 mysql数据库导入数据乱码

最近在导入其他人提供的SQL文件到MYSQL数据库中的时候，提示列太长，出现导入错误。通过查看数据库发现中文数据都是乱码。虽然在创建表的时候使用了default charset=utf8，但是还是存在乱码。原来是在导入的时候需要设置下面的命令。1. use database_name; 2. set names utf8; (或其他需要的编码) 3. source ex

2016-01-19 22:33:52 307

wangyj705的专栏