机器学习
JamesLi6
编程虽然很繁琐、乏味。但我会一直坚持下去,让大学的生活更充实一些。
展开
-
python 数据聚合与分组
python 数据聚合与分组前面讲完了字符处理,但对数据进行整体性的聚合运算以及分组操作也是数据分析的重要内容。通过数据的聚合与分组,我们能更容易的发现隐藏在数据中的规律。数据分组数据的分组核心思想是:拆分-组织-合并首先,我们了解下groupby这个函数import numpy as npimport pandas as pddata=pd.DataFrame({'level':['a...转载 2018-05-17 09:23:11 · 4418 阅读 · 0 评论 -
机器学习lightGBM的快速安装
环境:win10 + anaconda3LightGBM 是一个梯度 boosting 框架,使用基于学习算法的决策树。它可以说是分布式的,高效的,它有以下优势: 更快的训练效率 低内存使用 更好的准确率 支持并行学习 可处理大规模数据今天学习LightGBM,但是安装比较费事,最后终于找到了简单的方法。下面是具体的配置过程。方...原创 2018-05-16 15:59:31 · 4951 阅读 · 1 评论 -
Python datetime模块详解、示例
一、datetime模块介绍(一)、datetime模块中包含如下类:类名 功能说明date 日期对象,常用的属性有year, month, daytime 时间对象datetime 日期时间对象,常用的属性有hour, minute, second, microseconddatetime_CAPI 日期时间对象C语言接口timedelta 时间间隔,即两个时间点之间的长度tzinf...转载 2018-05-16 21:47:11 · 318 阅读 · 0 评论 -
标称型和数值型的区别
在监督学习(supervised learning)的过程中,只需要给定输入样本集,机器就可以从中推演出指定目标变量的可能结果。监督学习相对比较简单,机器只需从输入数据中预测合适的模型,并从中计算出目标变量的结果监督学习一般使用两种类型的目标变量:标称型和数值型标称型:标称型目标变量的结果只在有限目标集中取值,比如真与假(标称型目标变量主要用于分类)数值型:数值型目标变量则可以从无限的数...原创 2018-05-29 12:25:17 · 5054 阅读 · 0 评论