自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(37)
  • 收藏
  • 关注

原创 数据挖掘实训周报week8

本周理论学习主要学了特征组合特征交叉一种合成特征的方法,可以在多维特征数据集上,进行很好的非线性特征拟合。假设一个数据集有特征x1和x2,那么引入交叉特征值x3,使得:x3=x1x2那么最终的表达式为:y=b+w1x1+w2x2+w3x3使用One-Hot向量的方式进行特征交叉。这种方式一般适用于离散的情况,很少用于连续的数据集上。我们可以把特征交叉看成数据的逻辑与操作。在地图的方面的处理中,需要用到特征交叉。下图的房价和经纬度中,单纯的给出经度或者纬度,都不能直接反应房价和地理位置的关系。更好

2020-11-17 21:34:58 269

原创 数据挖掘实训周报week7

本周开始了新的大作业比赛的学习主要是学习了数据集的一些基本情况数据集包含约25000家企业数据,其中约15000家企业带标注数据作为训练集,剩余数据作为测试集。数据由企业基本信息、企业年报、企业纳税情况等组成,数据包括数值型、字符型、日期型等众多数据类型(已脱敏),部分字段内容在部分企业中有缺失,其中第一列id为企业唯一标识。主要一共有8个数据集,每一行代表一个企业的基本数据,需要给出企业是否有非法集资风险的预测概率值比赛采用分类任务的精确率 P(precision)、召回率 R(recall) 和

2020-11-11 00:28:34 447

原创 数据挖掘实训周报week6

本周主要学习了pla算法Percetron Learning Algorithm——感知学习算法。PLA用于解决的是对于二维或者高维的 线性可分 问题的分类,最终将问题分为两类——是或者不是。PLA算法即用来求向量W(用于预测的向量),使得在已知的数据中机器做出的判断与现实完全相同。当X为二维向量时,相当于在平面上画出一条直线将所有的点分成两部分,一部分同意发送,另外的不同意。PLA的优缺点:1.首先,PLA的算法是局限在线性可分的训练集上的,然而我们拿到一个训练集,并不知道其到底是不是线性可分,

2020-11-03 02:14:04 207

原创 数据挖掘实训周报week5

本周主要学习了关于特征选择的相关内容。特征选择主要有两个功能:减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解主要学习了正则化模型:正则化就是把额外的约束或者惩罚项加到已有模型(损失函数)上,以防止过拟合并提高泛化能力。损失函数由原来的E(X,Y)变为E(X,Y)+alpha||w||,w是模型系数组成的向量(有些地方也叫参数parameter,coefficients),||·||一般是L1或者L2范数,alpha是一个可调的参数,控制着正则化的强度。当用在线性

2020-10-26 23:36:17 162

原创 数据挖掘实训周报week4

本周主要看了一下XGBT的相关知识。gbdt全称梯度下降树,在传统机器学习算法里面是对真实分布拟合的最好的几种算法之一。其有三个优点,一是效果确实不错,二是即可以用于分类也可以用于回归,三是可以筛选特征。首先gbdt 是通过采用加法模型(即基函数的线性组合),以及不断减小训练过程产生的残差来达到将数据分类或者回归的算法。gbdt通过多轮迭代,每轮迭代产生一个弱分类器,每个分类器在上一轮分类器的残差基础上进行训练。对弱分类器的要求一般是足够简单,并且是低方差和高偏差的。因为训练的过程是通过降低偏差来不

2020-10-20 15:18:35 187

原创 数据挖掘实训周报week3

本周主要学习了xgboost。XGBoos是在AdaBoost和GBDT等提升算法基础上进行了优化的算法,一般来说,算法都是由模型、参数和目标函数三部分组成。模型可以理解为基函数(一个函数的固定形式,也就是函数只会在这个函数的基础上变化而不会丢掉的函数)和权重的组合即一类问题的算法。参数就是算法学习的结果,就像决策树学习产生的从根节点通往叶节点的路径q和每个叶节点上面的期望权重w,改变参数(q,w)就是改变已有模型。优化目标函数需要实现两个目的:第一:尽量让预测值接近真实值;第二:保证模型的泛化能力(Ge

2020-10-11 21:04:26 405

原创 数据挖掘实训周报week2

本周比赛主要进行了数据的预处理阶段。EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模.了解变量间的相互关系、变量与预测值之间的存在关系。第一步先进行变量分类和缺失值处理。缺没有的填补为0、查看数据分布比例 剔除不好的数据分布对异常的数据进行正态处理之后进行的建模过程,由于选择的模型出现问题目前还在解决暂时还没有排名与成绩还在努力...

2020-10-06 01:58:50 188

原创 数据挖掘实训周报week1

本次实训的课题还是数据挖掘,实训的形式主要以天池的比赛为主。第一项比赛为《零基础入门金融风控-贷款违约预测》,赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,是一个典型的分类问题。关于分类问题,之前的课程和一些项目都有涉及过,比如之前的数据挖掘课程做的便是表情识别的分类器。图象的分类,有着明确的判别标准,像与不像,表情的类别等等。而本次的金融类分类,初识数据不知从何处入手,并没有给出的“47列变量信息”和“是否可以贷款”之间关系的概念。

2020-09-29 00:19:17 724

原创 IT项目管理-管理方法与经验

在大作业中担任的角色,既有项目参与者,又有共同承担的项目经理的任务。项目经理不一定需要很强的开发能力,只要能有效的调动团队。但是良好的开发背景会让你很容易和员工沟通。项目经理需要具备以下几个能力理解力 - 每个人背景不同,工作不同,思维方式不同,不是任意的两个人都可以顺利沟通的,而你就是那个沟通的桥梁。沟通的前提是理解力,做为一个项目经理应该能充分理解每个团队成员的状态,态度,对问题的看法等等等等,应该是整个团队中最了解每个人的人。沟通能力 - 理解了之后就是传达和沟通,是否能游刃有余的说服与被说

2020-07-31 17:52:58 703

原创 IT项目管理HW8

1.90%的员工在系统推出后的两周内登录了该系统。该系统确定了60%的员工改善健康状况。90%的员工在系统推出后的一个月内完成了有关该系统的培训。把员工登陆系统当作培训计划的一部分,跟踪参加培训的人员。调查是否改善了健康状况。...

2020-07-27 22:02:25 105

原创 IT项目管理HW7

完成作业1~3的要求,使用 project 或其他项目管理工具1.成本模型:2.成本基线:3.a:成本偏差=EV - AC = 10 000美元进度偏差= EV - PV = -20 000美元成本绩效指数= EV / AC = 1.11进度绩效指数= EV / PV = 0.83b:落后计划、花费较低c:EAC = BCA / CPI = 18 000 美元项目比计划表现得好d:估计时间 = 初始时间 / SPI = 6/1.1 = 7.2月...

2020-07-20 18:13:01 188

原创 IT项目管理HW6

教材练习题6;2.教材练习题7;3. 收集网上资料,总结看板在软件项目中的使用看板管理,常作“Kanban管理”,是丰田生产模式中的重要概念,指为了达到及时生产(JIT)方式控制现场生产流程的工具。及时生产方式中的拉式(Pull)生产系统可以使信息的流程缩短,并配合定量、固定装货容器等方式,而使生产过程中的物料流动顺畅。·看板在项目流程中载体的分类(1) 实体白板/黑板这是敏捷开发团队中用的最多,最直接的一种看板类型,且适合团队所有成员都在一个办公室工作的环境。它的优点一目了然,方便工.

2020-07-13 21:22:06 192

原创 IT项目管理HW5

你联合同学做一个年级微信公众号加强各班相互了解、联合活动等。请写一份两页的报告,描述收集需求的方法,并附上收集的需求跟踪矩阵(不少于五个需求);需求:需求是指根据特定协议或其他强制性规范,产品、服务或成果必须具备的条件或能力。收集需求的方法:需求跟踪矩阵:2. 使用思维导图,为作业1或2构建WBS ,并使用项目管理工具制作WBS或根特图。并按要求检查工作包的可管理性,分解完整性。例如:检查测试、培训等可管理性、完整性:项目安排较为完整,成本只有运营成本,可管理性强。...

2020-06-17 10:17:08 152

原创 IT项目管理HW4

你联合同学做一个年级微信公众号加强各班相互了解、联合活动等。请编制项目章程和项目管理计划,指导该项目实施与运营。必须包含 WBS 和 甘特图;项目章程:·项目目的:创建年级公众号,加强各班联系,互相了解,联合活动·可测量的项目目标和相关的成功标准:目标为年级的大部分同学都关注了此公众号,并且管理方可以通过此公众号进行通知发布,活动告知,投票统计等功能,后台留言问题回答等都有人专门负责有序进行.·高层级需求:将有更多功能的小程序结合进公众号里,达到更好的服务效果。·整体项目风险:风险在于前期宣.

2020-06-02 21:17:55 172

原创 IT项目管理HW3

了解CMMI项目管理过程-项目计划(PP),使用知识域*过程矩阵对比项目规划过程组与CMMI-PP过程,具体要求:• 首先,绘制矩阵。矩阵行是十大知识领域,最后一行为其他知识;矩阵第一列是项目规划过程组,第24列分别是特定目标(SG)13;内容是项目管理过程或特定实践(SP)。• 最后,小结项目管理规划过程组与行业过程PP的联系与区别。联系:都是分阶段进行,各项目分成模块进行管理,覆盖面广区别:项目管理规划过程组相互独立而行业过程的就联系比较紧密阅读JWD案例的前期准备任务,结合创新.

2020-05-19 21:16:36 178

原创 IT项目管理HW2

IT项目管理HW2使用业务、组织、技术三维模型系统管理方法分析某校园项目 (可自定义)的可行性疫情期间,按照上级要求,学校计划在学生返校前对宿舍进行改造,将部分四人间改为双人间以减少人口密度。业务角度。本项目无疑是耗费巨大的项目,带来的收益可能不会具体体现。但按照科学的规划,以避免各地学生返校后交叉感染,导致学生身体健康出现问题,造成后续的医疗费用,所以此项目是收益远大的。影响成本的因素包括...

2020-05-04 20:37:58 262

原创 IT项目管理HW1

IT项目管理HW11. 描述projects、programs、 portfolio 、 operations 和 OPM 的概念·Projects(项目):项目是为创造独特的产品、服务或成果而进行的临时性工作·Programs(计划\项目组合):项目群或大型项目,是以协同的方式获取单独管理所无法取得之效益的一组项目·Portfolio(投资组合):项目组合,是跨越Project和prog...

2020-05-03 10:31:41 228

原创 Docker

安装Docker首先进行内核的升级完成后,先进行对yum的升级下来进行对docker的安装client 和 server都是成功的,便表示安装成功运行helloworld的镜像运行镜像显示镜像库显示容器拉取MySQL镜像练习和运行镜像...

2019-12-18 23:10:35 84

原创 模仿 Github,设计一个博客网站的 API

一、概述API是Application Programming Interface(应用程序接口)的缩写,它是拿来描述一个类库的特征或是如何去运用它。REST(Representational State Transfer)是Roy Fielding博士在2000年提出的软件软件架构模式。REST 是一种风格,而不是标准。因为既没有 REST RFC,也没有 REST 协议规范或者类似的规定。...

2019-11-22 17:21:48 234

原创 Cloudgo

Cloudgo1. 概述开发简单 web 服务程序 cloudgo,了解 web 服务器工作原理。任务目标熟悉 go 服务器工作原理基于现有 web 库,编写一个简单 web 应用类似 cloudgo。使用 curl 工具访问 web 程序对 web 执行压力测试2. 开发首先,选择一个框架,这里选择的是 martini框架,martini 是一个非常新的 Go 语言的 Web ...

2019-11-11 22:29:51 202

原创 unity5 —— 与游戏世界交互

Hit UFO 鼠标打飞碟的游戏一、游戏目的和要求1、游戏有 n 个 round,每个 round 都包括10 次 trial;2、每个 trial 的飞碟的色彩、大小、发射位置、速度、角度、同时出现的个数都可能不同。它们由该 round 的 ruler 控制;3、每个 trial 的飞碟有随机性,总体难度随 round 上升;4、鼠标点中得分,得分规则按色彩、大小、速度不同计算,规则可...

2019-10-08 19:37:33 210

原创 unity 4 游戏对象与图形基础

一、天空盒的构建在unity里面下载 Fantasy Skybox FREE,按照提示构建了几个游戏场景随意构建了一个天空的背景二、游戏对象的使用gameobject主要包括创建、获取、添加组件的过程。对于不同的对象,有着不同的处理方法。比如empty,就是用来创建空游戏对象,不予以显示,经常作为挂载载体使用;camera作为摄像机,主要显示游戏世界,是观察的窗口 ;Light : 光...

2019-10-07 01:35:59 136

原创 Unity——3空间与运动

一、简答题游戏运动的本质本质是游戏对象跟随时间与空间的变化。一般可以分为position和rotation(位置和角度)的变化。实现抛物线运动(1)、position:把抛物线运动分解为水平的叠加运动,与竖直方向的落体运动即创建两个方向的运动进行叠加using System.Collections;using System.Collections.Generic;usi...

2019-09-21 20:55:10 238

原创 3D游戏——第二节作业

一、简答题解释游戏对象(GameObjects) 和 资源(Assets)的区别与联系答:GameObjects 指游戏中实际使用的东西,屏幕上看见的东西。Assets 指游戏中需要的资源,项目文件中所堆放的资源联系:GameObjects是由Asset实例化后的对象,本质上其实还是Asset的衍变,是对部分Asset的引用和复制出来的新东西,其本质还是Asset。区别:下载几...

2019-09-09 21:22:49 301

原创 服务计算——配置私有云

配置私有云实验报告一、实验目的初步了解虚拟化技术,理解云计算的相关概念理解系统工程师面临的困境理解自动化安装、管理(DevOps)在云应用中的重要性二、实验环境和要求用户通过互联网,使用微软远程桌面,远程访问你在PC机上创建的虚拟机虚拟机操作系统 Centos,Ubuntu,或 你喜欢的 Linux 发行版,能使用 NAT 访问外网。三、实验内容安装 VirtualBox由...

2019-09-05 19:58:46 319

原创 A Smarter Gluttonous Snake

OK,上一篇博客我们见识了最弱智最初级版的字符型贪吃蛇,然后呢我们要将他升级,变成一个更机智也更贪吃的蛇,顺便也蹭一波AI的热度 变机智的关键就是要实现蛇蛇自己将所有的豆豆清屏,也就是要自己寻找食物最容易想到的方法是每次都横扫一行或者一列,这样子可以不吃到自己或者撞到墙,但是这样子太慢,也不算智能。然后想一下再机智一点的算法 先判断是否可以吃到食物 如果不能吃到食物,则让蛇头跟着蛇尾巴走——这

2017-12-27 15:28:10 231

原创 A Gluttonous Snake

贪吃蛇,绝对是每个人童年记忆里的游戏了吧。记得我小时候玩的贪吃蛇,还是诺基亚手机里自带的小游戏。而且当时对此特别着迷,经常与小伙伴们比赛刷新分数 而如今,诺基亚已经停产,也再也没有哪一款手机会自带贪吃蛇游戏了。但这款游戏早已经成为经典,成为记忆。今天让我们看下如何编写一个简单的贪吃蛇游戏。 由简入难,我们想象一下这个游戏的基本原理和操作 输出字符矩阵 WHILE not 游戏结束

2017-12-27 14:41:17 315

原创 IT风投——前景光明

风投——一个耸人听闻的名字,听到它貌似听到了洪水猛兽。这都由于人们对它的误解,曾经的人们认为风投就是吸金的无底洞,投进去的钱根本拿不回来。但真是的它并非如此。 风险投资(Venture Capital)简称是VC。广义的风险投资泛指一切具有高风险、高潜在收益的投资;狭义的风险投资是指以高新技术为基础,生产与经营技术密集型产品的投资。 他并不是一个只会融资的手段,而是可以各方面促进经济成长的新

2017-12-20 15:29:20 353

原创 C语言发展史——程序猿抗争史

刚入门的程序猿们,此时正在与磨人的小妖精——C语言在抗争。可能牺牲了几大把头发,换来的也只是对C语言的一知半解。俗话说得好:知己知彼,方能百战百胜。今天就让我们来看下这个C语言究竟来自何方。 首先我们知道,语言最开始可以分为机器语言与汇编语言。对于机器这种死板的东西,他大概只能识读01吧;而汇编语言则用代码减轻了机器的负担。 但由于汇编语言的局限性,人们迫切需要一些高级语言。

2017-12-15 20:31:09 501

原创 人工智能与伦理道德

人工智能近年开始成为公众热点,在围绕AI与人的方面也展开了激烈的讨论。 现在回想下,AI这个词进入我的视野好像在挺早的时候。当时在玩dota,有的dota地图的尾缀上会有AI的字样,这样的地图就意味着你可以添加机器人与自己对战。而添加的机器人是那种只会按固定套路游戏的角色,当时觉得AI特别蠢。这可能是我对AI最开始的印象吧 但从阿尔法狗打败李世石开始,人类对与AI有了重新的认识。AI已经不再

2017-12-06 13:55:08 8191

原创 自顶向下,逐步求精

“自顶向下,精益求精”一个听起来很高端的东西。但简单的来说,他就是一种思想,一种解决问题的思路。可能很多人会觉得这东西离我们日常生活很远,但是他其实融入了我们生活的许多方面。而“自顶向下,逐步求精”更是计算机的主要思维,掌握好这个方法,就可以更了解计算机是如何思维的了。从这张图就可以清楚的看出top - down的基本结构。 top - down 的处理问题方式就是先从主题入手分析全局,把握结构,

2017-11-30 16:17:00 336

原创 我的电路实践

所谓电路,大家第一次见到应该是物理实验课了。然后数学课本上又为大家简单地介绍了逻辑电路。而如今进入了大学,进入了计算机领域,当然要更深入了解电路,毕竟计算机的基础就是0与1构成的电路。好了,开始我的第一项电路实践——非门 用布尔语言表述就是 X= A’ 所谓非门就是将输入的数据反面输出出来 利用三极管与电阻就可轻松地做出一个非门电路 然后数据结果如下 INPUT(toggle swit

2017-11-20 00:55:45 257

原创 IT第一定律——Moore ‘s law

作为一个程序猿,要了解的第一个东西然是摩尔。。庄园了 呸。。。摩尔定律(忽略上图) 了解摩尔定律之前,还是了解一下他的创建者——戈登·摩尔。什么?你不认识戈登摩尔?那就请你低头看下电脑上的Intel标志(果粉自动忽略)。他便是大名鼎鼎的intel的创始人之一 题归正传,所谓摩尔定律就是: 当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍

2017-11-17 20:20:02 3960

原创 RGB——三原色到五颜六色

1958年,天津无线电子厂制造出了中国第一台黑白电视机,取名“北京”,被人誉为:“华夏第一屏 1970年,中国第一台彩色电视机也在天津诞生,那时的国产电视机里的显像管等核心部件都是进口的。 22年,从黑白到彩色,的确实现了质的飞跃。彩色电视机的出现不仅为人们的生活添加色彩,也为中国制造加速发展。 而彩色电视机的原理,便是这rgb。 RGB,

2017-10-25 01:04:07 3168

原创 艾伦图灵——人类亲手毁灭的第n个科学家

人类,在几千年的发展史中,总是会因各种原因毁灭完美的东西,加以毁灭那些伟大的人物。从文艺复兴时期的布鲁诺,到二战后的图灵。人类用手,扼死了一个又一个伟大的头脑,仅以达到所谓的政治目的。留给后人的只剩下,对先贤的缅怀与尊敬。真正的智慧与思想是永远不会被扼杀的!《模仿游戏》,15年的一部非常棒的电影,展示了艾伦图灵的短暂的一生。 小时候的图灵,孤僻,孤单,孤独。有着莫名的强迫症,因此总被其他的小伙

2017-10-18 12:59:07 1583

原创 初次用construct2编游戏

第一次自己做游戏,有点小兴奋。不过是特别。。弱鸡的游戏2333 运用的平台是construct2;游戏类型是射击类型(小人打怪兽。。。绿色的一坨) 首先,打开construct2,新建一个页面 然后,先设置游戏背景,选一个砖色背景。 在平台的左面调节他的位置和大小 接着,要设定一下layer 新建一个main的layer,将其解锁,然后后面的操作均在这个main

2017-10-08 13:40:35 424

原创 长安之味

西安,我来自的地方。长安,他的另一个名字。令人憧憬,令人向往;令人倾倒,令人回忆。 在外的游子,最想念的必然会是家乡的味道了吧。对于陕西的离家游子,回忆家乡的味道既是一种享受又是一种折磨。 面食篇 关中平原的土壤为小麦提供了得天独厚的生长条件,也为陕西人带来了口服。 油泼面,几粒葱花,几颗蒜末,一勺辣椒粉,一烧滚油,便可铸就一道面食的

2017-09-22 00:15:02 298

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除