自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 案例分析: 众包任务

用户下载APP,注册成为APP会员,然后从APP上领取需要拍照的任务(比如上超市去检查某种商品的上架情况),赚取APP对任务所标定的酬金。如果定价不合理,有的任务就会无人问津,而导致商品检查的失败。附件一是一个已结束项目的任务数据,包含了每个任务的位置、定价和完成情况(“1”表示完成,“0”表示未完成);附件二是会员信息数据,包含了会员的位置、信誉值、参考其信誉给出的任务开始预订时间和预订限额,原则上会员信誉越高,越优先开始挑选任务,其配额也就越大(任务分配时实际上是根据预订限额所占比例进行配发)。

2022-12-15 21:24:20 250 1

原创 Logistic Regression算法

信息与计算机科学在高度上的发展是以它的作用为基础的,在这种技术的发展道路当中,使用速度和它自身的性能一直都在人们的关注上不断提升着,而且也体现出了很大的效果。而且在实践应用当中,它能够把自身的价值全部都体现出来,包括在人们生活当中提供的便利、企业经营管理中提供的优势、教育当中带来的高效、国防上带来的安全以及科研上提供的动力等等。我们处于信息大爆发的时代,大数据中蕴含着丰富的资源,如何对数据进行科学的处理,提取其中有价值的信息,从而形成标准的可应用模型。以本次乳腺癌预测模型为例,在模型的验证中,

2022-12-15 20:23:27 311

原创 逻辑回归(Logistic Regression)

南斯拉夫卢布尔雅那大学医疗中心肿瘤研究所的威斯康辛乳腺癌数据集(由M.Zwitter 与M. Soklic 二者提供,该数据集在UCI数据库中找到)卢布尔雅那大学(Univerza v Ljubljani)成立于1919年,是斯洛文尼亚历史最悠久、规模最大的高等学府。位于首都卢布尔雅那市中心,教育设施先进,学生可以攻读从本科到博士的各种课程,学历为世界各国承认。(1)699条样本,共11列数据,第一列用语检索的id,后9列分别是与肿瘤相关的医学特征,最后一列表示肿瘤类型的数值。Mitoses 肿瘤特征9。

2022-12-15 20:22:13 253

原创 逻辑回归(logistic regression)

逻辑回归的实现上只是对线性回归的计算结果加上了一个Sigmoid函数,将数值结果转化为了0到1之间的概率(Sigmoid函数的图像一般来说并不直观,你只需要理解对数值越大,函数越逼近1,数值越小,函数越逼近0),接着我们根据这个概率可以做预测,例如概率大于0.5,则这封邮件就是垃圾邮件,或者肿瘤是否是恶性的等等。从直观上来说,逻辑回归是画出了一条分类线,见下图。正在上传…重新上传取消设我们有一组肿瘤患者的数据,这些患者的肿瘤中有些是良性的(图中的蓝色点),有些是恶性的(图中的红色点)。这里肿瘤的红蓝色可以被

2022-12-15 20:18:51 419

原创 逻辑回归 (logistic regression)

本论文采用逻辑回归预测人类乳腺癌的良性与恶性,Logistic回归(logistic regression)属于概率型非线性回归,是分析反应变量为独立分类资料的常用统计分析方法,由于对资料的正态性和方差齐性不做要求、对自变量类型也不做要求等,使得近年来Logistic回归模型在医学研究各个领域被广泛用,如流行病学、病因学的队列研究、病例对照研究,临床诊断的判别模型,治疗效果评价,各类癌症预测等。逻辑回归是一种与线性回归非常类似的算法,但是,从本质上讲,线型回归处理的问题类型与逻辑回归不一致。

2022-12-15 20:11:20 1329

原创 案例分析 众包任务

本案例的关键是在计算任务之间、任务与会员之间的距离,从而确定每个任务在5公里范围内具体包括哪些任务和会员,进而就可以计算其指标值了。A=pd.read_excel('附件一:已结束项目任务数据.xls')A=pd.read_excel('附件一:已结束项目任务数据.xls')A=pd.read_excel('附件一:已结束项目任务数据.xls')B=pd.read_excel('附件二:会员信息数据.xlsx')B=pd.read_excel('附件二:会员信息数据.xlsx')

2022-11-29 22:09:18 352

原创 Apriori关联规则挖掘算法函数

data=pd.read_table('超市商品购买.txt',engine='python',sep='、',encoding = 'gb2312',header=None)2)利用Apriori关联规则挖掘算法函数进行关联规则挖掘,最小支持度和最小置信度分别为0.2和0.4,并将挖掘结果导出到Excel表格中。tiem=['西红柿','茄子','水果刀','香蕉','袜子','毛巾','肥皂','排骨','酸奶','鸡蛋','鞋子','土豆']I1: 西红柿、排骨、鸡蛋、毛巾、水果刀。

2022-11-28 21:48:31 2742

原创 PCA(主成分分析)算法

原理:将数据从原来的坐标系转换到新的坐标系。第一个新坐标轴选择的是原始数据中方差最大的方向,第二个新坐标系选择和第一个坐标轴正交且具有最大方差的方向。该过程一直重复,重复次数为原始数据中特征的数目。结论:”运用PCA算法,将四维数据降为三维数据,根据贡献比为95%以上可计算出数据的特征值、特征向量、及主成分方差>=95%的百分比。print('基于主成分的综合排名为:',Rs)print("主成分方差百分比为:",gxl)print("特征向量为:",tzxl)print("特征值为:",tz)

2022-11-28 21:25:21 1232

原创 用线性回归分析命令,求出 PE 与 AT、V、AP、RH 之间的线性回归关系式系数向量(包括常数项)和拟合优度(判定系数)

在发电场中电力输出(PE)与 AT(温度)、V(压力)、AP(湿度)、RH(压强)有关,相关测试数据见“发电场数据.xlsx”文件,请完成以下任务:1)利用线性回归分析命令,求出 PE 与 AT、V、AP、RH 之间的线性回归关系式系数向量(包括常数项)和拟合优度(判定系数),并在命令窗口输出;2)今有某次测试数据 AT=28.4、V=50.6、AP=1011.9、RH=80.54,试利用构建的线性回归模型预测其 PE 值。print('PE值为:',R2)

2022-11-06 22:06:44 1579 1

原创 Logistic Regression iris

根据鸢尾花数据集样本,建立模型,以花萼长度、花萼宽度、花瓣长度、花瓣宽度这4个特征值来推断目标值,属于山鸢尾、虹膜锦葵、变色鸢尾的哪一种。Iris数据集是常用的分类实验数据集,由Fisher,1936年收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。测试数据:在模型检验时使用,用于评估模型是否有效。特征值:花萼长度、花萼宽度、花瓣长度、花瓣宽度。目标值: 山鸢尾、虹膜锦葵、变色鸢尾。训练数据:用于训练,构建模型。训练集:70%~80%测试集:20~30%

2022-11-06 22:04:37 259

原创 Python 鸢尾花的可视化

plt.title('鸢尾花花瓣的长度和宽度') if each else plt.title('鸢尾花花萼的长度和宽度')plt.xlabel('花瓣的长度(cm)') if each else plt.xlabel('花萼的长度(cm)')plt.ylabel('花瓣的宽度(cm)') if each else plt.ylabel('花萼的宽度(cm)')

2022-11-06 21:56:21 1589

原创 推荐系统 召回排序过滤

这样用户才能有机会在毫秒的延迟下,得到迅速的商品反馈。以商品为例,假设商品库存中有a、b、c、d四件商品,平台上一共有A、B、C、D、E五位用户,根据用户在平台上的行为和动作,我们基本能够获取到每位用户对于a、b、c、d四件商品大致的偏好程度。

2022-11-01 20:44:00 431

原创 回归 线性模型

然而,在实践中,所有这些模型都可能导致类似的交叉验证分数, 例如准确性或精确度/召回率,而受惩罚的最小二乘损失使用的岭分类有一个明显的计算机性能剖面选择。在路径的末尾,当alpha趋于零,解趋于普通的最小二乘时,系数会出现很大的振荡。的列之间具有近似线性相关性时, 设计矩阵趋于奇异矩阵,最小二乘估计对观测目标的随机误差高度敏感,可能产生很大的方差。是拟合一个带有回归系数的, 使得数据的实际观测值和线性近似预测的预测值之间的残差平方和最小的一个线性模型。该图显示了估计器系数的共线性的影响。

2022-10-23 23:16:22 281

原创 数据挖掘模型

数据挖掘 概念描述 与算法分类

2022-09-25 22:18:58 975

原创 了解核函数

核函数

2022-09-25 22:02:48 3259

原创 机器学习术语

机器学习术语

2022-09-13 18:12:48 859

原创 机器学习术语

机器学习常见术语

2022-09-13 18:10:06 786

原创 机器学习术语

数据挖掘 机器学习术语

2022-09-13 17:26:49 295

原创 PCI发展史

PCI(Peripheral Component Interconnect)是一种由英特尔(Intel)公司1991年推出的用于定义局部总线的标准。此标准允许在计算机内安装多达10个遵从PCI标准的扩展卡。

2022-06-27 20:14:38 416

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除