自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 python简单代码,以及爬虫案例

此Python爬虫程序将通过HTTP请求获取豆瓣电影TOP250页面的HTML内容,然后使用BeautifulSoup库解析HTML,并从页面上提取电影名称和评分信息,最后将这些信息打印输出。# 使用BeautifulSoup解析HTML页面。# 提取电影名称和评分信息并打印输出。10. Web框架Flask的示例。# 发送HTTP请求并获取响应内容。

2023-08-30 19:49:03 480

转载 Python基础小讲堂之条件分支与循环

对于算数操作符的前四个加减乘除,大家都懂,在python中对于a = a + 1 或b = b – 2 可以简写成 a += 1 或 b -= 2这种形式。双星号(**)也称幂运算操作符,左边称为底数,右边称为指数,使用python进行幂运算时要注意优先级的问题。接下来就是条件分支:if 条件:条件为真(True)执行的操作else:条件为假(False)执行的操作。在学条件分支与循环之前,先掌握一下python的基本操作符。条件分支与循环的初步介绍就到这里啦,我们下期再会!=是不等于,==是等于。

2023-08-29 21:19:42 50 1

转载 如何评估分类模型的好坏

一般来说,ROC曲线会更稳定,在正负样本足够(样本均衡)的情况下,ROC曲线会比较稳定,能够反映模型的整体质量。但是,即使是正样本非常少的情况下,PR表现的效果也比较好。因为,ROC曲线一般都处于对角线的上方,即模型的效果应该比瞎猜(猜中的概率为50%)要好,所以AUC的取值范围一般是[0.5,1]。显然,我们希望的是TPR越高越好,而FPR越低越好,即要求两条折线离得越开越好,这说明模型对于正负样本区分度更好。可以知道,KS曲线和ROC曲线一样,描述的都是TPR和FPR的关系,只是横坐标的取法不一样。

2023-08-28 16:12:26 97 1

转载 Python实现T检验

检验,适用于来自正态分布的某个样本均数与已知总体均数的比较,其比较目的是检验样本均数所代表的总体均数是否与已知总体均数有差别。已知总体均数一般为标准值、理论值或经大量观察得到的较稳定的参数。检验,适用于配对设计计量资料均数的比较,理论上假设配对差值服从正态分布,其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别。检验,适用于完全随机设计下两样本均数的比较,其目的是检验两样本所来自总体的均数是否相等,要求两样本所在的总体服从正态分布。(数据,已知总体均数)进行检验。检验,又称非独立两样本均数。

2023-08-28 16:09:10 115 1

转载 如何评估分类模型的好坏

一般来说,ROC曲线会更稳定,在正负样本足够(样本均衡)的情况下,ROC曲线会比较稳定,能够反映模型的整体质量。但是,即使是正样本非常少的情况下,PR表现的效果也比较好。因为,ROC曲线一般都处于对角线的上方,即模型的效果应该比瞎猜(猜中的概率为50%)要好,所以AUC的取值范围一般是[0.5,1]。显然,我们希望的是TPR越高越好,而FPR越低越好,即要求两条折线离得越开越好,这说明模型对于正负样本区分度更好。可以知道,KS曲线和ROC曲线一样,描述的都是TPR和FPR的关系,只是横坐标的取法不一样。

2023-08-26 14:00:54 170

转载 如何使用python连接MySQL数据库?

有个小插曲,MySQL和MariaDB相当于姐姐妹妹的关系,两者由同一个人(Widenius)创建的。MySQL被Oracle收购后,Widenius先生觉得不爽,于是搞了个MariaDB,可以完全替代MySQL。更新数据:UPDATE 表名称 SET 列名1=新数据1,列名2=新数据2 WHERE 某列=某数据;给出下载地址:MySQL,MariaDB,安装过程很简单,一路Next Step,不过要记好密码。插入数据:INSERT INTO 表名称(列名1,列名2) VALUES(数据1,数据2);

2023-08-25 19:20:36 39 1

转载 R语言主成分分析

具体来说,与Rape关系紧密的几个州为Michigan、Texas等,与Murder关系密切的州为Georgia等,与Assault关系紧密的州为Maryland等。以上就是用R语言进行主成分分析的三种方法,小伙伴们如果觉着有用,可以随意分享给更多的小伙伴,大家一起学习交流!prcomp这功能是R安装的时候就自带的,不用再特意安装其他包了,非常方便实用。与prcomp功能一样,princomp也不用额外安装包了。从这个选择主成分的碎石图里,也可以清晰看出,2是“拐点”,选2,没错。

2023-08-24 20:11:41 142 1

转载 spss---如何使用信度分析以及案例分析

毕竟问卷的设计者的想法跟被调查者的真实想法之间存在差距, 通过对问卷的预调查结果的信度分析可以找出问卷中的哪个题目设计得有问题——与整个问卷之间的关联性不大。为了保证问卷具有较高的可靠性和有效性,在形成正式问卷之 前,应当对问卷进行试测,并对试测结果进行信度和效度分析,根据分析结果筛选问卷题项,调整问卷结构,从而提高问卷的 信度和效度。法是教育研究中广泛采用的一种调查方法,根据调查目的设计的调查问卷是问卷调查法获取信息的工具,其质量高低对调查结果的真实性、适用性等具有决定性的作用。以f1为例,删除f1后,

2023-08-22 20:09:42 411

转载 SPSS--如何使用分层分析以及分层分析案例分享

有些是随机变异的结果,有些是各种偏倚所致的,而有些却是极其重要的需要揭示的结果(如效用修饰或交互作用)。因此,在计算出各层的效应估计值后,应对其进行检验与分析,以明确层别效应估计值的变化有无统计学意义和重要的流行病学意义。层别效应一致性的假设检验即 为同质性检验( homogeneity test)(即假设在各层有一个恒定的效应估计值) ,它是以一致效应的总估计值与层别效应估计值的比较为基础的,即在同质性假设条件下,期望数与实际观察数的比较。分层分析的最重要的用途是评估和控制混杂因子所致的混杂偏倚。

2023-08-21 19:10:04 1347 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除