自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 收藏
  • 关注

原创 第八周周报

第八周周报这次参加了一个新的数据挖掘比赛,企业非法集资风险预测,与新手赛相比,本次比赛的难度更大一些。数据处理本次比赛中,我起初按照上一次比赛贷款违约预测中的相关经验,直接将所有的表合并到一起,然后进行数据转化,将非数值型数据转化为数值型,填充缺失值,精简一些属性,然后采用lightgbm模型进行训练,但是训练结果提交却出错,我经过观察发现,是因为本次比赛中出现了贷款违约预测中不存在的情况,即主键对应的数据,出现重复项,因此,我转而首先分别处理各个不同的表。news_info 中,分别对每个id的

2020-11-17 15:45:56 495

原创 第七周周报

第七周周报这次的天池贷款违约预测比赛,是我第一次参加数据挖掘这方面相关的比赛,经过七周的时间,从学习数据挖掘相关知识,数据预处理,建模到特征工程,参数优化,我从中学习到了数据挖掘领域的许多知识。数据预处理在本次的比赛中,我感受到了数据处理的重要之处,通过恰当地处理数据,能够大幅地提升预测的水平,我从这次比赛中,也学习到了很多数据处理的方式。在数据处理之前,我们首先需要了解数据本身的特点,需要观察,数据的缺失情况,数据的一致性,是否存在矛盾的数据,数据中的数值型与非数值型数据,数据的分布情况,通过对数

2020-11-17 15:32:52 516

原创 第六周周报

第六周周报在第五周周报中,我认为我很难再通过数据的处理,提高模型的训练水平,因此,我决定通过调整模型的参数,来提高我的模型,在上一周中,我学习了贝叶斯调参的方法,并且将其运用到了我的模型中,取得了不错的成果。贝叶斯调参相对于一些其他的调参方法,例如网格搜索,网格搜索通过遍历所有的参数组合,从而得出最优的结果,但是,对于本次比赛数据量较多的情况下,网格搜索的耗时相当长,而贝叶斯调参通过基于目标函数的过去评估结果建立替代函数,来找到最小化目标函数的值。它在尝试下一组参数时,会参考之前的评估结果。因此贝叶斯

2020-11-03 10:01:35 905

原创 第五周周报

第五周周报在上一周,我做的主要还是数据预处理的工作首先,我采用了分箱法,对原数据中一些连续数据进行了处理,分箱法将连续数据离散化,有助于模型的稳定性,降低了程序过拟合的风险,在当前的实验中,我才用了等频分箱的方法。另外,我对于原数据,也进行了压缩处理,主要是对于数值型数据,对于整形数据,判断该属性其最大值与最小值所处的区间范围(8,16,32,64位整数)的范围之内,并将其转换为相符合的类型整数。通过以上的操作,虽然测试集的成绩,并没有显著提升,但是,大大减少了硬件负担以及提高了训练的效率。另

2020-10-27 10:41:02 735

原创 第四周周报

第四周周报在上一周中,我完成的内容主要有:数据处理以及模型选择与数据训练。数据处理我对于原数据中一些字符型数据,转换为数值型数据,如:employmentLength列中的< 1 year 与 10+ years,我首先将其转换为0 year与10 year,然后,只取数字部分,这样讲字符转换为了数值。对于subGrade,我将其从A1到G5映射到了1到35。我还将原数据中一些列删除,降低数据的维度,加快训练速度,并同时排除掉一些与结果无关的列,如id’,‘isDefault’,‘po

2020-10-20 21:13:20 435

原创 第三周周报

第三周周报在上一次课上,我们学习了数据预处理的一些知识,因此,我在上一周的时间里,对所给的数据,进行了一些研究。1. 数据处理1.11.1.1 只有单一值的数据python的nunique可以用于判断数据是否单一值,最后测试出policyCode只有单一值。1.2 数据类别1.2.2 一些连续型变量的分布债务收入比:贷款金额:年收入:1.2.3 一些离散型变量subGrade:employmentLength:homeOwnership:经过对变量的分析,我们可以删

2020-10-12 21:18:56 349

原创 第二周周报

第二周周报数据分析在建立模型,对数据进行训练分析之前,需要对数据的整体,有一个大概的了解,了解数据的种类,范围,缺失情况等信息,我在上一周对数据的总体情况进行了分析,以下是其中的一部分。数据大小数据总览数据缺失实战结果在翻阅资料的过程中,我看到一个思路,就是利用数据中的贷款等级进行预测,这个思路比较的简洁明了,因此上一周我的实践就是根据这一方面进行的。首先,我们假定,原数据所给的信用评级,一定是有其道理的,因此,我们可以利用这个评级,通过对训练集中每个评级的违约率进行统计,即可以作

2020-10-06 10:50:27 680

原创 第一周周报

第一周周报理论学习为了完成本学期的实训内容,我在本周完成了以下准备。复习数据挖掘理论课的内容,我从新学习了数据挖掘的一些理论,了解了线性回归,决策树等知识,学习了数据挖掘的理论内容。由于我是第一次参加天池的竞赛,我在上一周,也通过我们参加的竞赛的baseline讲解,了解了竞赛的主要流程,以及我们可能的切入点,需要利用的数据。了解了我们解决问题的流程:数据预处理 ,处理数据中缺失的,不合理的数据。特征提取 及选择模型选择实践学习根据baseline中的讲解,我接触了提供的g

2020-09-29 13:16:55 279

原创 it项目管理 个人报告

it项目管理 个人报告本次选择的it项目管理这门选修课,要求我们组队分阶段完成大作业。在一个近20人的小组中合作的体验与要求,是与之前的课程中3,4人小组不相同的。对于人数众多的小组,在合作之前,需要确立组长,负责统筹兼顾,如果没有设立组长,则只能是一盘散沙,从本次实践中来看,如果缺乏组织人物的话,大作业基本就毫无进展。而在it项目管理的过程中,组员主要需要划分为各个不同的小组,各司其职,我们小组主要从项目发展的阶段的视角出发,将小组成员大致划分为需求小组,项目经理,开发小组几个方面,不同的小组,各自

2020-08-05 11:37:20 282

原创 it项目管理个人作业八

it项目管理 个人作业八题目我选择的是第2项作业,教材操作案例1-3,具体如下:解答1. 需求系统推出后两个星期内90%的员工都能够登入到系统中。系统上线一个月后,能够使得登入系统的员工们,平均医疗保健费用能够降低40%。系统上线后两周后,能够使登入系统的员工们,每周运动时间平均增加100%。系统上线后一周后,能够使登入系统的员工们,平均吸烟频率下降50%。系统上线后,系统能够容纳全部员工同时使用而不会崩溃。系统上线后,页面的平均响应时间不会超过2s。2.满足需求的过程系统

2020-07-29 11:26:02 317

原创 it项目管理第七次作业

it项目管理第七次作业题目解答WBS条目小时数单位小时成本(美元)子层总和(美元)WBS2级总和(美元)占总和的百分比1.项目管理40000201.1项目经理160100160001.2 其他项目成员40060240002.需求定义1000053.网站设计40000203.1娱乐节目的注册20050100003.2班级和节目的注册20050100003.

2020-07-22 10:55:00 177

原创 it项目管理第六次作业

it项目管理第六次作业题目教材练习题6;教材练习题7;收集网上资料,总结看板在软件项目中的使用(约2-3页)1.教材练习题6a.网络图b.路径及长度A-B-E-I-J-K 14天A-B-E-H-K 10天A-C-F-I-J-K 16天A-C-F-H-K 12天A-D-G-J-K 15天c.关键路径及长度A-C-F-I-J-K 16天d.最短时间完成该项目所需要的最短时间是16天教材练习题7练习四内容:网络图:3. 收集网上资料,总结看板在软

2020-07-15 11:20:03 293

原创 it项目管理第五次作业

it项目管理第五次作业题目收集需求与定义范围(请三选二)。你联合同学做一个年级微信公众号加强各班相互了解、联合活动等。请写一份两页的报告,描述收集需求的方法,并附上收集的需求跟踪矩阵(不少于五个需求);使用教材 中的微型案例( Running Case ),请写一份两页的报告,描述收集需求的方法,并附上收集的需求跟踪矩阵(不少于五个需求) ;使用思维导图,为作业1或2构建WBS ,并使用项目管理工具制作WBS或根特图。并按要求检查工作包的可管理性,分解完整性。例如:检查测试、培训等。1… 你

2020-06-16 21:46:05 442

原创 it项目管理第四次作业

it项目管理第四次作业要求分析与工具(请三选二)。你联合同学做一个年级微信公众号加强各班相互了解、联合活动等。请编制项目章程和项目管理计划,指导该项目实施与运营。必须包含 WBS 和 甘特图;请根据教材 HYM 公司案例(教材第四章 Running Case),选择并完成其中一个任务;召开一个项目策划研讨会,每个人用思维导图记录会议内容,该图必须满足“话题跟踪、热点标注、要点排序、问题汇总”四个基本要求。最后,给出这样会议记录的优点与缺点。1. 你联合同学做一个年级微信公众号加强各班相互了解

2020-06-03 10:51:38 414

原创 it项目管理第三次作业

it项目管理第三次作业题目了解CMMI项目管理过程-项目计划(PP),使用知识域*过程矩阵对比项目规划过程组与CMMI-PP过程,具体要求:• 首先,绘制矩阵。矩阵行是十大知识领域,最后一行为其他知识;矩阵第一列是项目规划过程组,第2-4列分别是特定目标(SG)1-3;内容是项目管理过程或特定实践(SP)。• 最后,小结项目管理规划过程组与行业过程PP的联系与区别。阅读JWD案例的前期准备任务,结合创新项目实践,构建软件项目创新竞赛项目准备过程(组),该过程(组)目标交付物为Business

2020-05-20 18:05:24 434

原创 it项目管理第二次作业

问题使用业务、组织、技术三维模型系统管理方法分析某校园项目(可自定义)的可行性;有人说企业信息化是“一把手工程”。通过网络搜索IT项目缺乏高级管理层支持失败案例,运用思维导图或系统模型描述高级管理层支持的重要性;选CMMI、ASPICE、ITIL、COBIT5或其他任一IT行业标准,围绕1-2张结构或原理图,解释它运用系统化思维决解行业问题方法;三选CMMI、ASPICE、I...

2020-05-06 10:02:15 294

原创 it项目管理第一次作业

这里写自定义目录标题欢迎使用Markdown编辑器概念欢迎使用Markdown编辑器概念project :项目是为创造独特的产品,服务或成果而进行的临时性工作。programs:项目集是一组相互关联且被协调管理的项目,子项目集和项目集活动,以便获得分别管理所无法获得的效益。portfolio:项目组合是为实现战略目标而组合在一起管理的项目,项目集,子项目组合和运营工作的集合。...

2020-05-03 10:37:39 309

原创 按课件内容实践docker

按课件内容实践docker安装环境首先,需要升级centos7的内核升级前:升级后:升级完毕后,安装docker环境验证是否安装成功docker version运行镜像docker run hello-worlddocker run -it ubuntu bash显示本地镜像库内容docker images显示运行中容器docker ps显示所有容器d...

2019-12-16 22:19:31 145

原创 博客网站的REST API设计

博客网站的REST API设计作业题目要求REST API介绍设计一个博客网站的API获取用户所有的博客的摘要获得一篇文章的详细内容获得一篇文章的评论内容更新一篇文章发布一篇文章删除一篇文章获取某月文章认证登陆错误信息作业题目博客网站的REST API设计要求仿造github设计一个博客网站的REST APIREST API介绍REST是Representational State T...

2019-11-19 17:30:55 362

原创 CLI 命令行实用程序开发实战 - Agenda

CLI 命令行实用程序开发实战 - Agenda实验内容实验过程安装必要的包初始化并添加相应指令完善指令registerloginentity中相应函数的实现测试实验内容功能需求: 设计一组命令完成 agenda 的管理,例如:agenda help :列出命令说明agenda register -uUserName –password pass –email=a@xxx.com :注...

2019-10-22 10:54:42 344

原创 以提交实验内容为例介绍git的简单用法

以提交实验内容为例介绍git的简单用法git的来源git的产生是由于有程序员企图破解BitKeeper,被其公司发现,收回了linus社区的免费使用权,于是Linus用了差不多两周的时间用c写了一个分布式版本控制系统,git,它也迅速流行起来,本篇文章所要介绍的,也是git的一次应用。一次应用首先,调用 git clone ,从远程库克隆到本地克隆完毕后,将文件加入到该文件夹中,然后调...

2019-09-15 18:31:34 154

原创 让你的计算机也能提供云桌面服务

让你的计算机也能提供云桌面服务1.实验目的2. 实验环境与要求3. 实验内容1. 安装VirtualBox2.创建Linux虚拟机3. 配置用远程桌面访问你的虚拟机1.实验目的初步了解虚拟化技术,理解云计算的相关概念理解系统工程师面临的困境理解自动化安装、管理(DevOps)在云应用中的重要性2. 实验环境与要求实验需要硬件虚拟化(AMD-V 或 Intel-VT)支持,部分旧笔...

2019-09-01 17:36:36 397

原创 字符版本贪吃蛇游戏设计

在前面的智能蛇游戏中,我已经将我的全部代码都贴出来了,大家也都看到了我的成果,虽然存在很多bug,但总算是有一个初步的构架了,接下来,我要与大家分享一下这条蛇的艰难成长过程。顺利的起始首先,当然是最顺利的一个部分啦,那就是除去最基本的图像打印了,这我想也不用多说,大家接触到这个作业时,肯定噼里啪啦就打出了一个大概的框架了,因此,在这里我就一笔带过了。略微艰难的中程那么,在顺利地完成了框架后,我就开始

2017-12-23 21:16:20 919

原创 字符游戏——智能蛇

经过了漫长的一学期地学习,一直以来的C语言作业都给我们留下了C似乎只能做数学题这样的一种重要却无趣的功能,这不禁让人有些厌烦。然而,这两周的软件工程导论作业却令我们耳目一新,作业的要求是让我们用C语言完成一个简单的贪吃蛇游戏,并且在此基础上让其“智能”化,即能够自己寻找食物。在我的程序编写过程中,出现了很多令人啼笑皆非的bug,在令人捧腹大笑地同时,也增加了对C语言地兴趣。好了,话不多说,接下来我要

2017-12-23 20:53:17 574

原创 It行业风投

风投的概念风险投资(Venture Capital)简称是VC,广义的风险投资泛指一切具有高风险、高潜在收益的投资;狭义的风险投资是指以高新技术为基础,生产与经营技术密集型产品的投资。 也就是说,资本家们为了盈利,把自己的资金投入到自己看好的行业中。风投的特征1、有发展潜力的市场 2、科技是针对市场的需要 3、可建立市场优势 4、可成为市场领导者 5、管理层有才能及远见 6、有丰厚的回报

2017-12-17 20:05:31 981

原创 万丈高楼之基石——C

可能对于很多计算机专业的学生来说,第一门接触的语言就是C了,同样的,他也令很多刚接触编程的人觉得很无趣,不友好的黑框界面,编写出的代码貌似没什么作用,只能用来做几道计算题,实在是很难让人提起学习C语言的兴趣,相反,其他面向对象的语言,却很轻易就能做出很有趣的东西,貌似C语言确实没有什么用。然而,C语言自1972年诞生,屹立于瞬息万变的IT界,数十年而不倒,至今仍占据很大的份额,必定有其优越之处。C语

2017-12-08 17:26:35 436

原创 AI 与 人类

在各种科技片中,总会出现各种机器人产生自我意识后各种吊打人类的情景,我们总是会担心人类被机器人统治,其实这也是有其道理的,正是由于机器人那各方面超越人类的能力,让人类对自己可能无法控制的事物产生了恐惧心理。什么是人工智能? 人 工 智 能 技 术 简 称 AI(ArtificialIntelligence),AI作为一门学科,于1956 年问世,是由“人工智能之父”麦卡锡(McCartney)

2017-12-08 16:57:48 901

原创 Top-Down design

程序设计初学者往往看到复杂的题目及input而不知所措,自乱阵脚,不知道从何入手解决。其实,如果能够将一个复杂的问题自上而下逐步分解为一个个小的,能被我们解决的问题,换句话说就是分而治之,那么我们就能够逐步完成看似庞杂的程序。简而言之,即利用“自顶向下,逐步求精”(Top-Down)的方法。    •“自顶向下” 是将复杂、大的问题划分为小问题,找出问题的关键、重点所在,然后用精确的思维定性

2017-11-26 22:09:01 720

原创 html5游戏制作(2)

首先是对gif文件的截取,在这里,我截取了中学时期一个化学实验的动态图。 这是铝热反应,他的强度由此可见。接下来便进入了正题,对html5游戏的制作。 首先是游戏策划: 楔子(Setting):星际时代,主角为了拯救世界,与黑暗势力作斗争,驾驶战机知道敌军基地。 玩法(Gameplay):玩家操纵战机与邪恶的敌人作战,与凶险的宇宙博斗 人设与道具(Game Sprites):Player:

2017-11-19 16:20:03 1590

原创 安迪-比尔定律对我们生活的影响

it界有三大定律,摩尔定律,反摩尔定律及安迪-比尔定律。它们对我们的生活产生了巨大的影响。就拿安迪比尔定律来说吧: 在百度百科上,它的定义是这样的:安迪-比尔定理 (Andy and Bill’s Law)是对IT产业中软件和硬件升级换代关系的一个概括。原话是 “Andy gives, Bill takes away.(安迪提供什么,比尔拿走什么。)” 安迪指英特尔前CEO安迪·格鲁夫,比

2017-11-13 18:27:57 2296

原创 简单电路

任务1建立非门功能(O = A’)验证电路: INPUT(toggle switch) OUTPUT(led) ON(1) off(0) OFF(0) Yellow(1)任务 2:验证电路等价 任务 3:理解存储电路 任务 4:设计全加电路 (1) 画出一位的全加电路 (2) 画出二位的全加电路(过于复杂,只能使导线交叉)

2017-11-13 18:13:00 498

原创 用程序求最大公约数的简单方法

最大公约数计算是计算机最大的优势,对于我们来说,可以把一些比较复杂的计算交由计算机完成,今天我要提及的便是用计算机求取最大公约数。简单暴力法:

2017-10-24 19:32:38 6534

原创 IT人物——冯诺依曼

计算机之父冯诺依曼(1903-1957),原籍匈牙利,后入籍美国,是20世纪伟大的数学家,在计算机科学与博弈论领域中有诸多成果。第二次世界大战期间为第一颗原子弹的研制作出了贡献。为研制电子数字计算机提供了基础性的方案。1944年与摩根斯特恩合著《博弈论与经济行为》,是博弈论学科的奠基性著作。著作《量子力学的数学基础》《计算机与人脑》《经典力学的算子方法》《博弈论与经济行为》

2017-10-15 14:47:33 3474

原创 初探Construct2(一)

初探Construct2(一)作为代码新手,相信很多人都对平时打的代码的枯燥无味而感到厌烦,不论自己打了什么代码,总是只能显示在cmd的无聊的黑框中,这不能不说大大降低了我们的热情。而Construct2,这样的一款软件,却可以使我们充分享受制作一款游戏的乐趣,因为这是一款几乎不用打代码就可以使你制作出一款有趣的html5游戏的软件,好了,话不多说,接下来就让我展示一下我这几天的成果吧。 我所完成

2017-10-06 10:14:41 927

原创 ENIAC的历程

ENIAC的历程相信这是一台计算机,事实上,这世界上第一台通用电子计算机是一个庞然大物,用了18000个电子管,占地170平方米,重达30吨! 这样的一个庞然大物,其计算速度甚至远不如今天小巧玲珑的笔记本电脑,这或许会让当今的很多人失望,然而对于当时的人来说,这确是一件了不起的成就,可以说是新时代的预兆。 —————————————————————他的由来——————————————

2017-09-20 22:48:56 2773

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除