- 博客(46)
- 资源 (4)
- 收藏
- 关注
原创 数据结构课程设计:迷宫问题(一)
一、实验要求:问题描述以一个m*n的长方阵表示迷宫,0和1分别表示迷宫中的通路和障碍。设计一个程序,对任意设定的迷宫,求出一条从入口到出口的通路,或得出没有通路的结论。基本要求 实现一个以链表作存储结构的栈类型,然后编写一个求解迷宫的非递归程序。求得的通路以三元组(i,j,d)的形式输出,其中:(i,j)指示迷宫中的一个坐标,d表示走到下一坐标的方向。 编写递归形式的算法,求得迷宫...
2020-04-08 11:52:05 8795 13
原创 SDU项目实训记录4.3——其它模型的实现(7.24)
SDU项目实训记录4.3——其它模型的实现一、RandomForestClassifier模型(随机森林)二、GradientBoostingClassifier 模型三、AdaBoostClassifier模型
2021-07-24 22:38:03 293
原创 SDU项目实训记录4.2——其他模型的学习(7.22)
SDU项目实训记录4.2——其他模型(集成学习)一、随机森林1、原理2、流程3、影响随机森林性能的参数二、Gradient Boosting1、原理2、流程三、AdaBoost1、原理2、流程3、优势
2021-07-23 21:53:13 402
原创 SDU项目实训记录4.1——模型稳定性(7.20)
SDU项目实训记录4.1——模型稳定性一、PSI(Population Stability Index)二、代码及结果一、PSI(Population Stability Index)定义: 群体稳定性指标PSI是衡量模型的预测值与实际值偏差大小的指标;稳定度指标可衡量测试样本及模型开发样本评分的分布差异,为最常见的模型稳定度评估指标。其实PSI表示的就是按分数分档后,针对不同样本,或者不同时间的样本,population分布是否有变化,就是看各个分数区间内人数占总人数的占比是否有显著变化。
2021-07-22 23:21:53 275 1
原创 SDU项目实训记录3.3——信用评分(7.15)
SDU项目实训记录3.3——信用评分一、基础知识二、实现过程一、基础知识评分卡设定的分数刻度值通过将分值表示为比率对数的线性表达式来定义score = A –Blog(Odds) , 其中Odds = p/(1-p) ,p为违约概率,常数A B可以通过两个已知假设分值带入到公式中,通常需要以下两个假设:在某个特定比率设定特定的预期分值指定比率翻倍的分数PDO规定: odds=1:60时 P0=600 PDO=20推导公式可得:B = PDO / log(2)A = P0 + B *
2021-07-16 20:54:29 224 1
原创 SDU项目实训记录3.2——模型评估(7.12)
SDU项目实训记录3.2——模型评估一、模型准确性1、正确率、精度、召回率、F1(1)概念(2)实现2、AUC(1)概念(2)实现二、模型区分度KS(Kolmogorov-Smirnov)(1)概念(2)实现
2021-07-13 11:32:22 305
原创 项目实训记录3.1——逻辑回归模型(7.11)
SDU项目实训记录3.1——逻辑回归模型一、处理数据集二、拆分x、y,WOE转化三、训练模型并预测1、机理2、实操
2021-07-12 18:01:54 493
原创 SDU项目实训记录2.3——特征选择(7.8)
SDU项目实训记录2.3——特征选择一、基础1、特征选择的必要性2、特征信息度的计算和意义二、方法1、单变量分析2、多变量分析3、特征删除
2021-07-08 20:30:39 194 1
原创 SDU项目实训记录2.2——分箱并计算WOE&IV(7.6-7.7)
SeriousDlqin2yrs RevolvingUtilizationOfUnsecuredLines age NumberOfTime30-59DaysPastDueNotWorse DebtRatio MonthlyIncome NumberOfOpenCreditLinesAndLoans NumberOfTimes90DaysLate NumberRealEstateLoansOrLines NumberOfTime60-89DaysPastDueNotWorse NumberOfDepende
2021-07-07 10:55:56 556
原创 SDU项目实训记录2.1——数据预处理(7.6)
SDU项目实训记录1.5——数据预处理一、分析数据集二、数据预处理1、装载数据集2、判断重复值3、处理缺失值(1)直接删除缺失值所在行(2)用众数填充NumberOfDependents缺失值,随机森林推算MonthlyIncome拆分数据集一、分析数据集样本数有15万条,特征变量有12个数据字典如下:翻译成中文:Variable NameDescriptionTypeSeriousDlqin2yrs好客户坏客户Y/NRevolvingUtilizationOf
2021-07-06 18:26:58 320
原创 SDU项目实训记录1.5——异常值处理(7.2)
SDU项目实训记录1.5——异常值处理一、四分位数二、箱形图三、Tukey‘s Test1、理论知识2、实际操作
2021-07-02 20:41:15 227 2
原创 SDU项目实训记录1.4——数据预处理基础(7.1)
SDU项目实训记录1.4——数据预处理基础一、~~标准化和归一化~~二、拆分数据集1、数据集划分2、流程与方法3、技术与实现三、~~文本的数值化处理~~四、检测和处理缺失值与重复值1、流程与方法2、技术与实现五、离散化和分箱处理1、流程与方法2、技术与实现
2021-07-01 17:42:00 506
原创 SDU项目实训记录1.3——基础知识(6.29-6.30)
SDU项目实训记录1.3——基础知识一、数据处理入门1、Numpy学习与使用2、基本统计量3、生成随机变量4、Pandas文件读取二、获取数据分布特点及可视化展现
2021-06-30 18:48:32 294 1
原创 SDU项目实训记录1.2——环境配置(6.28)
SDU项目实训记录1.2——环境配置一、环境要求:python+anaconda+jupyter二、配置过程1.安装anaconda2.配置anaconda环境变量3.增加Anaconda中国镜像4.创建虚拟环境5.安装模块库
2021-06-28 15:07:45 222
原创 SDU项目实训记录1.1——项目介绍(6.28)
SDU项目实训记录1.1一、实训题目题目名称:基于信用评分卡算法模型的个人信用评级系统的设计与实现题目来源:企业(中软国际)二、项目背景三、项目要求四、实训目标五、系统功能六、技术方案七、环境要求
2021-06-28 14:46:17 385 1
原创 《数据科学导论》三元闭包现象的数据验证
三元闭包现象的数据验证三元闭包问题源代码课后练习输入: T时刻和T+1时刻n个人之间朋友关系快照(本题n=7)输出: 两个当前不是朋友的人的“共同朋友个数”与“在下一快照中成为朋友的概率”基本思路一、用networkx+matplotlib绘制快照的网络结构1、安装networkx库2、绘制结果如下图所示二、得到当前快照补图(以下皆以快照1、2为例)利用nx.complement(G1)直接得到快照1(G1)的补图Gt,由于是无向图得到的边(u,v)存在v>u的情况,遍历Gt.e
2021-01-19 17:34:04 1623
原创 山东大学《数据库系统》实验九
实验题目:条件数据插入实验目的:学会复制表结构、学会插入数据,特别是学会如何避免重复插入,也就是如何避免插入已经存在的数据。实验原理和方法:创建表、创建唯一不重复索引、插入数据最后一个实验特别简单实验步骤:实验题目 11.创建表 test9_01,表的结构同 pub.student_11_1 一样。Create table test9_01(sid char(12) not null,name varchar(10) not null,sex char(2),age int,
2021-01-16 00:33:34 880
原创 山东大学《数据库系统》实验八
实验题目:提交 commit 和回滚 rollback、实体授权实验目的:对比有无索引情况下数据检索速度,学会如何能够使用索引,掌握如何查询是否使用索引了。实验原理和方法:启动两个不同浏览器,主账号 userID 在 firefox 中登录、备用账号 userbID 在另外一个浏览器登录,或者主账号在主平台登录,备用账号在备平台登录,或者主账号和备用账号分别在两台电脑登录。测试提交 commit 和回滚 rollback 的作用,了解锁等待、授权等知识。具体操作在实验指导书里,早就删了emm
2021-01-16 00:29:13 1391
原创 山东大学《数据库系统》实验七:索引
实验题目:索引重要性、提高速度实验目的:对比有无索引情况下数据检索速度,学会如何能够使用索引,掌握如何查询是否使用索引了。实验原理和方法:按 sid、name 建立两个索引。create UNIQUE index student_10_sid on student_10(sid)create index student_10_name on student_10(name)对比索引列 sid 和非索引列 sid1 进行查询,观察耗时select * from pub.student_10
2021-01-16 00:25:22 1784
原创 山东大学《数据库系统》实验六:视图操作
实验题目:创建视图、删除视图实验目的:oracle 管理平台,针对公共用户 pub 下的表,完成创建视图、查询验证视图、删除视图。视图名为 test6_(题号,题号长度两位,前面补零),例如 test6_01。实验原理和方法:例如:找出年龄小于 20 岁的所有学生的学号、姓名、年龄 正确执行:create view test6_00 as select sid,name,age from pub.student where age>20Oracle扩展后方便写法:create or rep
2021-01-16 00:15:48 1964
原创 山东大学《数据库系统》实验五:报表统计
实验题目:报表统计实验目的:学习掌握 sum,count 函数和 group by 的用法。部分题目可以使用 union all 来解决。实验原理和方法:复制表结构及其数据:create table table_name_new as select * from table_name_old更新语句:update table_name set 列名=表达式\子查询 [where 条件表达式]sql很简单,懒得改锁进了:)实验步骤:在学生表 pub.student 中统计名字
2021-01-16 00:11:09 3367 1
原创 山东大学《数据库系统》实验四
实验题目:复制表、修改表结构、修改数据实验目的:利用 oracle 管理平台完成对表的结构、数据进行修改,每一个问题可以通过多个 SQL 语句完成。实验原理和方法:复制表结构及其数据:create table table_name_new as select * from table_name_old添加一列:alter table table_name add (column1列名 [column2 列名…])更新语句:update table_name set 列名=表达式\子查询
2021-01-16 00:06:14 2551 2
原创 山东大学《数据库系统》实验三:复制表、删除数据
实验题目:复制表、删除数据实验目的:将 pub 用户的表及数据复制到主用户下,对不符合要求的数据进行删除。实验原理和方法:复制表结构及其数据:create table table_name_new as select * from table_name_old删除语句:delete from r where p实验步骤:1.将pub用户下的Student_31及数据复制到主用户的表test3_01,删除表中的学号不全是数字的那些错误数据,学号应该是数字组成,不能够包含字母空格等非数字字符。
2021-01-11 17:24:50 2117
原创 山东大学《数据库系统》实验二:检索查询
实验题目:检索查询实验目的:能够掌握并熟练运用检索查询语句实验原理和方法:将查询语句创建成视图:如test2_01,test2 代表实验二,01 代表题目1:Create or replace view test2_01 as select……根据题目要求写出答案查询语句,将查询结果创建到一个视图中,点击题目 交卷验证结果是否正确。提示:1、任何select 确保只返回一个结果可以是另外一个select的一个输出表达式。格式如: select sid,(select… …) 列别名 from
2021-01-11 17:03:57 2962
原创 山东大学《数据库系统》实验一
实验题目:熟悉环境、建立/删除表、插入数据实验目的:创建 3 个表,为每个表输入 2 行数据,没有逻辑难度,只是熟悉环境,学会创建表。 表名、列名采用英文,oracle 不区分大小写,有 not null 的列代表不允许为空。实验原理和方法:建表语句:Create table test1_student (sid char(12),name varchar2(10));插入语句:Insert into test1_student values(‘200020002000’,‘王菲’);实验步骤
2021-01-11 16:48:48 989
原创 利用python绘制新冠疫情数据曲线图
”在举国上下万众一心、众志成城做好新冠肺炎疫情防控工作的特殊时刻,我们不能亲临主战场,但我们能坚持在大战中坚定信心、不负韶华。“1、爬取新闻保存为json文件,并将绘图所需数据保存至数据库数据库表结构:代码部分:import pymysqlimport reimport sys,urllib,jsonfrom urllib import requestfrom datetime import datetimeimport pandas as pdToday=datetime.now.
2020-04-08 23:21:13 2466
原创 山东大学《Python程序设计与大数据分析》lab9
问题描述:以一个m*n的长方阵表示迷宫,0和1分别表示迷宫中的通路和障碍。设计一个程序,对任意设定的迷宫,求出一条从入口到出口的通路,或得出没有通路的结论。
2020-04-08 21:59:08 820
原创 山东大学《Python程序设计与大数据分析》lab8
实验八:程序设计方法论一、实验类型:验证型、设计型二、建议学时:4三、实验内容:1、阅读教材《Python 语言程序设计基础》第8章:程序设计方法论2、验证型练习:2.1、验证8.2 实例15:体育竞技分析的整个流程和实例代码2.2、验证8.7 实例16:pip 安装脚本 (不用提交,直接在自己机器上安装后进行测试)3、设计型练习:教材P36 程序练习题8.1,8.4四、实验...
2020-01-14 23:34:50 749
原创 山东大学《Python程序设计与大数据分析》lab7
实验七:文件与数据格式化一、实验类型:验证型、设计型二、建议学时:4三、实验目的:掌握Python中文件操作与数据格式化操作的方法四、实验内容:1.阅读教材第7章:文件与数据格式化2.验证型练习:2.1 验证7.1 文件操作方法和函数(教材 P183-185 表7.1~表6.7)(不用提交作业)2.2 验证7.2 PIL库操作的方法和函数(教材 P188-193 表7.4~表7...
2020-01-14 22:10:45 1207
原创 山东大学《Python程序设计与大数据分析》lab6
实验六:组合数据类型应用练习一、实验类型:设计型二、建议学时:4三、实验要求:1、阅读教材第6章:组合数据类型2、验证型练习:2.1、验证序列类型、集合类型、列表类型、字典类型的相关操作方法和函数(教材 P156-167 表6.1~表6.5) (注:该部分练习不用提交)2.2、验证6.5 jieba库常用的分词函数(表6.6)(注:该部分练习不用提交)2.3、验证6.6 实例10...
2020-01-14 20:16:11 537
原创 山东大学《Python程序设计与大数据分析》lab5
实验五:函数与代码复用一、实验类型:验证型+设计型二、建议学时:4三、实验要求:阅读教材第5章:函数与代码复用四、实验内容:验证型:1、验证lambda函数(不用提交作业)2、验证教材5.2函数的参数传递中的部分实例(不用提交作业)3、验证教材5.3 模块3:datetime库的使用中的表5.1-5.3部分函数 (不用提交作业)4、验证教材5.4 实例7:七段数码管绘制中实例...
2020-01-14 19:55:16 679
原创 山东大学《Python程序设计与大数据分析》lab4
实验四:Python语言程序控制结构一、实验类型:验证型+设计型二、建议学时:4三、实验目的:1、继续熟悉IDLE、Python开发环境的基本操作、熟悉Python基本输入输出函数或语句的用法、熟悉Python标准库和扩展库的导入和使用方式;2、掌握利用程序控制结构编程方法;3、掌握Python内置random函数的用法四、实验内容:(1)验证型:教材第4章中的BMI范例程序选和P...
2020-01-14 19:47:42 280
原创 山东大学《Python程序设计与大数据分析》lab3
实验三:Python语言基本数据类型操作一、实验类型:验证型+设计型二、建议学时:4三、实验目的:1、了解Python语言程序的基本数据类型 2、掌握简单问题的IPO方法四、实验内容:1、阅读教材第3章;2、验证型练习:(1)验证内置数值运算符和内置数值运算函数表3-2~3-3 (2) 验证math库中的各种类型的函数:表3-5~3-9(3)验证表3-12 常用的内置字符串处理方法...
2020-01-14 19:28:35 757
原创 山东大学《Python程序设计与大数据分析》lab2
实验二:Python语言程序实例分析与验证一、实验类型:验证型+设计型二、建议学时:4三、实验目的:1、继续熟悉IDLE、Python开发环境的基本操作、熟悉Python基本输入输出函数或语句的用法、熟悉Python标准库和扩展库的导入和使用方式;2、掌握利用程序控制结构编程方法;3、掌握Python内置random函数的用法四、实验内容:(1)验证型:教材第4章中的BMI范例程序...
2020-01-14 18:49:24 623
原创 山东大学《Python程序设计与大数据分析》lab1
实验一:熟悉Python语言开发环境和Python语言程序基本结构一、实验类型:验证型+设计型二、建议学时:4三、实验目的:1、继续熟悉IDLE、Python开发环境的基本操作、熟悉Python基本输入输出函数或语句的用法、熟悉Python标准库和扩展库的导入和使用方式;2、掌握利用程序控制结构编程方法;3、掌握Python内置random函数的用法四、实验内容:(1)验证型:教材...
2020-01-14 18:28:00 359
原创 山东大学《c++程序设计》lab4
实验目的:熟悉c++的类、对象。熟悉c++的重载、继承。实验步骤与内容:1、建立一个学生类,一个对象数组,内放5个学生的数据(学号、成绩),用指针指向数组首元素,输出第1,3,5学生的数据。建立一个函数bestStudent,用指向对象的指针作函数参数,在函数中找出5个学生中成绩最高者,并输出其学号。在主函数main()中,调用bestStudent#include <io...
2020-01-14 16:52:09 330
原创 山东大学《c++程序设计》lab3
实验目的:熟悉c++的指针、引用,运算符new和delete。熟悉c++的类和对象。实验步骤与内容:1、在main函数中接受从键盘输入的3个整数,调用下面的三个函数进行排序,然后输出排序后的结果。实现函数sort1(int x, int y, int z),sort2(int *px, int *py, int * pz),sort3(int &x, int &y, i...
2020-01-14 16:44:16 398
原创 山东大学《c++程序设计》lab2
实验目的:熟悉c++的数组熟悉c++的指针、引用。实验步骤与内容:1、创建源程序文件myFunctions.cpp,在其中定义下列函数:1)findMaxElement1D(), 返回一维数组中的最大值2)findMaxElement2D(), 返回二维数组中的最大值3)sort1D(), 对一维数组用冒泡法排序#include <iostream>using nam...
2020-01-14 16:31:51 548
原创 山东大学《c++程序设计》lab1
实验目的:熟悉c++的表达式、运算符、简单程序设计实验步骤与内容:1.请写出下列表达式的值,并编写一个程序验证。(1)3.53+27-‘a’=-72.5(2)26/3+34%3+2.5=11.5(3)45/2+(int)3.14159/2=23(4) a=b=(c=a+=6) 设a的初值为3 a=9(5) a=35,a=b=32 a=6(6) (int)(a+6.5)%...
2020-01-14 16:19:26 1012
原创 山东大学《数据结构》实验七:图的操作
实验七 图的操作一、 实验目的掌握无向图的创建、遍历方法。二、 实验内容1、创建图类,存储结构使用邻接矩阵。2、输入图的节点数 n(不超过 10 个)、边数 m,节点分别用 1-n 代表。3、采用“起始节点,终止节点,权值”输入图的 m 条边,创建图。4、输出从节点 1 开始的 BFS 遍历,在遍历过程中,如有多个可以选择 的节点,则优先选择编号较小的节点。5、输出从节点 1 开始...
2020-01-14 15:53:07 1933
Python程序设计.rar
2020-01-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人