自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

JamesLi6的博客

编程小记

  • 博客(9)
  • 资源 (7)
  • 收藏
  • 关注

原创 标称型和数值型的区别

     在监督学习(supervised learning)的过程中,只需要给定输入样本集,机器就可以从中推演出指定目标变量的可能结果。监督学习相对比较简单,机器只需从输入数据中预测合适的模型,并从中计算出目标变量的结果监督学习一般使用两种类型的目标变量:标称型和数值型标称型:标称型目标变量的结果只在有限目标集中取值,比如真与假(标称型目标变量主要用于分类)数值型:数值型目标变量则可以从无限的数...

2018-05-29 12:25:17 5053

转载 python数据分析之数据聚合和分组运算

group by技术pandas对象中的数据会根据你所提供的一个或多个键被拆分为多组,拆分操作是在对象的特定轴上执行的,然后将一个函数应用到各个分组并产生一个新值,最后所有这些函数的执行结果会被合并到最终的结果对象中。>>> from pandas import *>>> df=DataFrame({'key1':['a','a','b','b','a'],'...

2018-05-17 13:46:54 702

转载 python 数据聚合与分组

python 数据聚合与分组前面讲完了字符处理,但对数据进行整体性的聚合运算以及分组操作也是数据分析的重要内容。通过数据的聚合与分组,我们能更容易的发现隐藏在数据中的规律。数据分组数据的分组核心思想是:拆分-组织-合并首先,我们了解下groupby这个函数import numpy as npimport pandas as pddata=pd.DataFrame({'level':['a...

2018-05-17 09:23:11 4414

转载 Python datetime模块详解、示例

一、datetime模块介绍(一)、datetime模块中包含如下类:类名 功能说明date 日期对象,常用的属性有year, month, daytime 时间对象datetime 日期时间对象,常用的属性有hour, minute, second, microseconddatetime_CAPI 日期时间对象C语言接口timedelta 时间间隔,即两个时间点之间的长度tzinf...

2018-05-16 21:47:11 318

原创 机器学习lightGBM的快速安装

环境:win10 + anaconda3LightGBM 是一个梯度 boosting 框架,使用基于学习算法的决策树。它可以说是分布式的,高效的,它有以下优势:        更快的训练效率        低内存使用        更好的准确率        支持并行学习        可处理大规模数据今天学习LightGBM,但是安装比较费事,最后终于找到了简单的方法。下面是具体的配置过程。方...

2018-05-16 15:59:31 4948 1

转载 机器学习:机器学习GBDT、XGBoost、LightGBM介绍

本文主要简要的比较了常用的boosting算法的一些区别,从AdaBoost到LightGBM,包括AdaBoost,GBDT,XGBoost,LightGBM四个模型的简单介绍,一步一步从原理到优化对比。AdaBoost原理原始的AdaBoost算法是在算法开始的时候,为每一个样本赋上一个权重值,初始的时候,大家都是一样重要的。在每一步训练中得到的模型,会使得数据点的估计有对有错,我们就在每一步...

2018-05-16 14:23:40 557

转载 特征工程之特征选择

特征工程是数据分析中最耗时间和精力的一部分工作,它不像算法和模型那样是确定的步骤,更多是工程上的经验和权衡。因此没有统一的方法,这里只是对一些常用的方法做一个总结。1. 特征的来源    在做数据分析的时候,特征的来源一般有两块,一块是业务已经整理好各种特征数据,我们需要去找出适合我们问题需要的特征;另一块是我们从业务特征中自己去寻找高级数据特征。我们就针对这两部分来分别讨论。2.  选择合适的特...

2018-05-16 10:58:56 1001 1

原创 sklearn的train_test_split

train_test_split是交叉验证中常用的函数,功能是从样本中随机的按比例选取训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签格式:     (X_train,X_test, y_train, y_test =cross_validation.train_test_split(train_data,train_target,test_size=0.3, random_s...

2018-05-15 19:59:07 503

转载 Ubuntu常用快捷键总结

Ubuntu常用快捷键总结桌面常用快捷键Alt + F1:聚焦到桌面左侧任务导航栏,可按上下键进行导航Alt + F2:运行命令Alt + F4:关闭当前窗口Alt + Tab:切换程序窗口Alt + 空格:打开窗口菜单PrtSc:桌面截图Win + A:搜索/浏览程序Win + F:搜索/浏览文件Win + M:搜索/浏览音乐文件Win:搜索/浏览程序、文件、音乐文件等常见终端快

2018-05-08 22:23:03 1422 1

软件工程专业ppt课件

软件工程专业以计算机科学与技术学科为基础,强调软件开发的工程性,使学生在掌握计算机科学与技术方面知识和技能的基础上熟练掌握从事软件需求分析、软件设计、软件测试、软件维护和软件项目管理等工作所必需的基础知识、基本方法和基本技能,突出对学生专业知识和专业技能的培养,培养能够从事软件开发、测试、维护和软件项目管理的高级专门人才。

2018-01-07

计算机编译原理课件资源

内容包括语言和文法、词法分析、语法分析、语法制导翻译、中间代码生成、存储管理、代码优化和目标代码生成。 编译原理是计算机专业设置的一门重要的专业课程,这是编译原理一个不错的一个讲义,和大家分享

2018-01-07

数据结构(C语言版)严蔚敏版配套实现程序

数据结构严蔚敏版课本的配套实现程序 数据结构(C语言版)(严蔚敏版配套实现程序

2017-10-06

全国计算机等级考试四级计算机网络真题.

全国计算机等级考试四级计算机网络真题第一套,打印比较方便

2017-10-06

A parallel approximate SS-ELM algorithm based on MapReduce

A parallel approximate SS-ELM algorithm based on MapReduce for large-scale datasets

2017-06-23

白书acm练习题

关于编程方面的一道模板类的题目,有兴趣的可以关注一下。感觉这道题目不错。

2015-10-24

经典的搜索算法

经典的搜索算法的的讲解,讲的太好了,不能再好了,绝对超棒。

2015-08-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除