自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 企业非法集资风险预测第一次周报

一般数据挖掘基本步骤查看数据填补缺失值编码特征选取选取适当算法模型查看数据先查看基本的行列数目然后查看年报信息中违法和不违法的比例填补缺失值查看缺失值后发现很多表的数据都有较多缺失,而且不好填补,所以对于缺失比例大于0.5的列直接删除。编码对于object类型编码对于tax数据编码再处理info数据然后是数据分桶和交叉特征特征选取模型选取主要选取catboost模型来跑初次成绩如下:...

2020-11-13 20:14:57 849 1

原创 贷款违约预测第七周周报

贷款违约预测数据挖掘题目总结这次的贷款违约预测数据挖掘题目算是告一段落,成绩不是很好,只有0.722,但是也算是积累了一些数据挖掘的经验,也有一些心得体会。数据挖掘其实大致分为几个步骤:数据预处理,选取特征值,选取模型,调整模型参数,评估。其中,数据预处理是一个比较复杂的工作,需要处理缺失值,需要对较大或较小的数据进行取舍,需要将部分字符数据做量化等等。在这次数据挖掘题目中,我大部分精力其实是在选取特征值和调参上,数据预处理只是简单的用中位数填补了缺失值,然后对一些不能量化的数据进行了量化,然后在

2020-11-06 13:43:06 164

原创 贷款违约预测第六周周报

数据降维上周主要是对已有模型做了调参处理,成绩大概比没调参上升了0.01分,所以要想继续上升,就只有对模型再进行处理了,所以接下来将会对模型进行降维处理。这里的降维主要采用PCA降维方法,代码如下:降维后对模型进行简单的测试:发现成绩和没降维差不多,但是可能是参数没调整的原因,下周将会对降维后的模型参数进行调整。成绩截图...

2020-10-30 21:14:28 138

原创 贷款违约预测第五周周报

已有模型参数调整上周对已有的模型的参数进行了一次调整,有一定效果,这周继续对剩余没有调整的参数进行调参。对subsample和colsample_bytree参数进行调参:最优参数为subsample:0.7,colsample_bytree:0.8再对learning_rate和n_estimators两个参数进行调参:learning_rate和n_estimators两个参数跑得比较久,跑了18个小时,最后得到最优参数是learning_rate:0.05,n_estimators

2020-10-23 11:24:28 173

原创 贷款违约预测第四周周报

模型优化上周主要对训练集的一些特征值进行了一定分析,画了简单的统计图进行查看,这周主要是在上周的数据分析基础上,继续优化模型,从而得到更优的结果。数据处理后,这次主要是针对所用的xgboost算法来进行模型调参:本次调参主要是选取了xgboost算法中的部分参数首先优化max_depth,min_child_weight两个参数:得到最优参数为:max_depth:8,min_child_weight:1然后是gamma参数:得到最优参数为:0.05最

2020-10-15 20:35:51 96

原创 贷款违约预测第三周周报

进一步数据分析上一次对数据进行了简单的特征值处理,填补了缺失值,将数据格式做了处理,用基本原版的数据跑了一遍模型,成绩一般,所以这周将对数据进行进一步的分析处理,筛选出有更有意义的特征数据来进行训练,从而得出更好的结果。首先根据常识分析,判断是否违约,有几个特征值是一般来说比较关键的:贷款金额、贷款人的年收入。这两个变量是直观来看,一个人是否会违约的关键数据,比如我贷款1块钱,那我没道理违约,我年收入一亿元,那我大概率也不会违约。当然这只是直观的想法,具体的分析在统计图上看出:首先是贷款金额的数据

2020-10-11 18:46:28 114

原创 货款违约预测第二周周报

数据分析上次主要查看了数据的类型以及是否缺失,这次数据分析首先查看各个特征的基本统计量:知道了各个特征的一些基本统计量之后,先查找出数据中的对象特征和数值特征,再查看缺失数据的多少:然后用一般的平均数来填充缺失值:发现都已经填充完毕。再用随机森林模型填补就业年限数字:之后再对部分特征进行合并,以及对grade和subGrade进行手动编码:初步模型检验利用最原始的数据来进行检验:可以得到一个最初的结果,当然后续还要进行一系列优化。以

2020-10-05 15:58:40 168

原创 货款违约预测第一周周报

AUC评估方法AUC是一种机器学习的评估方法,通常的AUC是指在ROC曲线下的面积,那么要弄懂什么是AUC,首先要知道什么是ROC。初步理解的ROC是一个输出结果只有两种类型的模型,主要利用混淆矩阵来进行计算。其中的一些参数主要有:假正例(FP):若一个实例是负类,而被预测为正类。真正例(TP):若一个实例是正类,而被预测为正类。而ROC曲线的x轴为假正例率,y轴为真正例率。AUC即为ROC曲线与坐标轴围成图形的面积,其值通常介于0.5和1之间,越接近1时真实性越高,反之则真实性越低。

2020-09-28 23:05:08 165 1

原创 IT项目管理大作业个人报告

在团队中担任的角色第一次团队作业:现有校园生活APP应用功能的总结与分类。对中大APP的学习与科研以及学术活动功能整理。对职业规划发展进行总结与分类。撰写具体的文档以及附带截图说明。第二次团队作业:对项目管理软件进行对比分析。体验TAPD软件的功能,并做出产品特色的报告。整理出TAPD软件支持的业务以及内含的实用工具。第三次团队作业:撰写“收集需求”的方法文档。主要对问卷调查这个收集需求的方法进行深挖。总结问卷调查方法的过程与目的、类型、形式以及使用的技术。

2020-08-02 16:53:06 786

原创 IT项目管理作业八

RUNNING CASE第一题90%的员工在系统推出后的两周内登录了该系统。90%的员工在系统推出后的四周内完成了有关该系统的培训。该系统帮助确定了25%的员工如何改善健康状况。25%的员工已将改善健康的目标纳入系统,并通过报名参加项目、课程等方式采取行动改善健康状况。Benchmarks已经建立了基准,以确定该系统的用户友好程度和速度。第二题可以非常直接地衡量90%的员工是否在系统推出后两周内登录了系统。由于IT部门需要建立登录,系统应该有所有员工的姓名和总人数。另外,一份报告可以生

2020-07-26 22:48:16 177

原创 IT项目管理作业七

教材第一题WBS条目小时数单位小时成本(美元)子层总和(美元)WBS 1级总计(美元)占总和的百分比1.项目管理4400022%1.1 项目经理320100320001.2 项目团队成员20060120002.需求定义15060900090005%3.网站设计3600018%3.1 娱乐节目注册1506090003.2 班级节目注册1506090003.3 跟踪系统

2020-07-19 16:16:57 202

原创 IT项目管理作业六

教材第六题第一问第二问:路径1:A-B-E-H-K,路径长度=2+2+2+2+=10天路径2:A-B-E-I-J-K,路径长度=2+2+2+5+1+2=14天路径3:A-C-F-H-K,路径长度=2+3+3+2+2=12天路径4:A-C-F-I-J-K,路径长度=2+3+3+5+1+2=16天路径5:A-D-G-J-K,路径长度=2+4+6+1+2=15天第三问:关键路径为A-C-F-I-J-K,长度为16天。第四问:最短时间为16天教材第七题网络图关

2020-07-11 18:02:26 233

原创 IT项目管理作业五

年级微信公众号需求收集的方法头脑风暴:大家群体讨论,开放性的收集项目或产品需求 。访谈:进行“一对一”访问,了解用户需求。焦点小组:对相似的问题或者指定专题进行研讨。问卷调查:采用五点量表或者对开放问题进行调查。标杆对照:对于同类的公众号进行比较,分析竞品并学习。需求的跟踪矩阵标识需求描述项目目标优先级优先级说明001各个班级情况介绍让每个同学能充分了解各个班级情况,加深对年级的认识高认识是了解的基础,是年级微信公众号必要的关键需求00

2020-06-12 18:16:11 182

原创 IT项目管理作业四

MYH公司案例第一题项目名称企业战略财务收益其他收益初步估值休闲和健康网站项目降低成本4年内减少240万美元的成本提高健康水平和生产力,降低保险费高潜力,可以说服人们参与到项目中来健康保险费用商业模式降低成本4年内减少160万美元的成本通过协商降低保险费高潜力,前期花费10万美元交叉销售系统增加交叉销售3年内减少300万美元的成本增加销售量,改善客户服务中等潜力,每年80万美元网络增强通信系统利用Web通信3年内减少600万美元的成本

2020-05-29 15:30:08 248

原创 研究项目管理过程与领域知识及其关系

CMMI项目管理过程-项目计划(PP)矩阵比对矩阵:

2020-05-20 15:36:44 142

原创 利用系统方法分析COBIT5解决问题的原理

系统及系统方法简述系统系统是为实现某种目的而在同一环境中工作的一些列相互影响的部分系统分析一种问题求解方法。需要定义系统范围,分解为多个组成部分,识 别问题、机会、限制和需求。注意1:系统分析的难点是定义范围。注意2:复杂系统分解不是唯一的,通常使用多视图分析法。SWOT:对被分析对象的优势、劣势、机会和威胁等加以综合评估。系统化思维把观察到的相关系统的属性、事件...

2020-05-02 14:47:50 673

原创 IT项目管理中projects、programs和portfolio之间的关系,附带operations以及OPM之间的关系分析

Projects、programs、portfolio、operations以及OPM概念projects(项目):项目是一个特殊的、将被完 成的有限任务,它是在一定时间内,满足一系列特定目标的 多项相关工作的总称。programs(项目集):以协同的方式获取单独管理所无法取得之效益的袭一组项目,也可以理解为一组相互联系的Projects。portfolio(项目组合):项目组合是为实现战...

2020-04-30 11:54:29 1656

原创 智能蛇

博主初学c,简单的做了一个贪吃蛇,在此记录下我做贪吃蛇的过程,不足之处望各位博友见谅。      因为博主才疏学浅,所以博主这次只用数组来完成这个程序。      话不多说,直接上码。      主函数:int main()  {      int dir=UP;      while (1){        print_game();

2017-12-21 18:07:35 230

原创 IT行业的风投

风险投资简称是VC,在中国是一个约定俗成的具有特定内涵的概念,其实把它翻译成创业投资更为妥当。广义的风险投资泛指一切具有高风险、高潜在收益的投资;狭义的风险投资是指以高新技术为基础,生产与经营技术密集型产品的投资。根据美国全美风险投资协会的定义,风险投资是由职业金融家投入到新兴的、迅速发展的、具有巨大竞争潜力的企业中一种权益资本。“风险投资”这一词语及其行为,通常认为起源于美国,是20

2017-12-18 18:04:01 242

原创 python简介

Python,是一种面向对象的解释型计算机程序设计语言,由荷兰人 Guido  van Rossum于1989年发明,第一个公开发行版发行于1991年。 Python是纯粹的自由软件,源代码和解释器CPython遵循 GPL(GNU General Public License)协议。Python语法简洁清晰,特色之一是强制用空白符(white space)作为语句缩进。P

2017-12-12 18:59:50 261

原创 AI的伦理问题

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用

2017-12-11 15:15:10 1843

原创 自顶向下,逐步求精方法

自顶向下是将复杂、大的问题划分为小问题,找出问题的关键、重点所在,然后用精确的思维定性、定量地去描述问题。      逐步求精是将现实世界的问题经抽象转化为逻辑空间或求解空间的问题。复杂问题经抽象化处理变为相对比较简单的问题。经若干步抽象(精化)处理,最后到求解域中只是比较简单的编程问题。      自顶向下,逐步求精的方法在打代码中经常用到。      例如要打出如图所示的图案 

2017-11-26 20:49:25 598

原创 电路加法

任务一:非门电路任务二:验证A(B+C)=AB+AC任务三任务四:一位全加电路任务五:二位全加电路

2017-11-20 21:56:21 326

原创 摩尔定律还会有效吗

摩尔定律作为计算机发展的三大定律之一,其意义也是深远的。        先简单介绍下摩尔定律:摩尔定律是由英特尔(Intel)创始人之一戈登·摩尔(Gordon Moore)提出来的。其内容为:当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。换言之,每一美元所能买到的电脑性能,将每隔18-24个月翻一倍以上。这一定律揭示了信息技术进步的速度

2017-11-18 21:53:38 578

原创 摩尔斯密码简介

摩尔斯电码(又译为摩斯密码,Morse code)是一种时通时断的信号代码,通过不同的排列顺序来表达不同的英文字母、数字和标点符号。它发明于1837年,发明者有争议,是美国人塞缪尔·莫尔斯或者艾尔菲德·维尔。 摩尔斯电码是一种早期的数字化通信形式,但是它不同于现代只使用零和一两种状态的二进制代码,它的代码包括五种: 点、划、点和划之间的停顿、每个字符间短的停顿(在点和划之间)、每个词之间中等的

2017-10-22 23:06:45 3245

原创 约翰·冯·诺依曼

2017-10-14 23:22:14 650

原创 如何使用construct2制作射击小游戏

首先,你需要下载一个construct2,如果制作简单游戏,免费的即可。 然后准备几张图片,分别代表: 1、子弹 2、射击者 3、被射击者 4、背景 5、特效(比如爆炸什么的) 如博主准备的就是这几个: 准备好后,便打开软件,进去双击空白页,先插入背景,再插入其他的图片。 然后便是点开event sheet,进行各种设计,如图: 鉴于本人也只是初学,对这个软件了解并不深,故在此只

2017-10-07 21:30:53 501

原创 简析英雄联盟皮城女警近期改动的影响

欢迎中意女警的玩家一起探讨,本人也是千场女警玩家,从S3到现在都有玩。

2017-09-23 21:22:22 922

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除