#数据科学包
王二小、
这个作者很懒,什么都没留下…
展开
-
机器学习---数据科学包---时间日期
课堂学习笔记时间序列复习datetime时间序列时间日期时间戳:固定时刻固定时期period:pd.Period时间间隔interval:由起始时间和结束时间表示,固定时期是一个特殊的时间间隔时间日期的作用:分析金融数据,如股票交易数据分析服务器日志复习datetime...原创 2019-11-07 09:39:28 · 279 阅读 · 0 评论 -
机器学习---数据科学包---数据导入导出
课堂学习笔记数据I/O索引及列名/缺失值处理逐块读取数据保存数据到磁盘二进制数据其他格式数据I/O索引及列名缺失值处理逐块读取数据保存数据到磁盘二进制数据其他格式简介索引及列名/缺失值处理逐块读取数据保存数据到磁盘二进制数据pickle包其他格式HDF5: HDF是个用C语言实现的库,可以高效地读取磁盘上的二进制存储的科学数据Excel文件:pd.exce...原创 2019-11-01 18:46:16 · 337 阅读 · 0 评论 -
机器学习---数据科学包---聚合计算
课堂学习笔记聚合计算内置聚合函数自定义聚合函数一次性应用多个聚合函数不同的列应用不同的聚合函数分组数据变换transform分组数据合并,传统方法:mergetransform用自定义函数调用transform聚合分组 apply聚合计算内置聚合函数自定义聚合函数 agg一次性应用多个聚合函数不同的列应用不同的聚合函数重置索引内置聚合函数自定义聚合函数一次性应用多个聚合函...原创 2019-11-01 16:55:54 · 275 阅读 · 0 评论 -
机器学习---数据科学包---分组计算
课堂学习笔记分组计算列分组 字典分组按行分组多级索引分组分组计算分组三部曲:拆分–应用–合并拆分:根据什么分组?应用:每个分组进行什么计算合并:把每个分组的计算合并起来按列分组通过字典分组通过函数分组通过索引级别分组列分组 字典分组按行分组多级索引分组...原创 2019-11-01 14:36:50 · 234 阅读 · 0 评论 -
机器学习---数据科学包---numpy基础运算
课堂学习笔记机器学习---数据科学包一numpy的学习numpy的属性numpy的创建arraynumpy的基础运算一numpy的基础运算二numpy的索引numpy的array合并numpy的array分割numpy的copy & deep copy机器学习—数据科学包一numpy的学习numpy的属性import numpy as nparray = np.array([[1...原创 2019-09-05 18:24:23 · 194 阅读 · 0 评论 -
机器学习---数据科学包---pandas基本操作
课堂学习笔记机器学习---数据科学包二pandas的学习ipython初体验pandas 入门一pandas的DataFrame类型下的基本操作pandas入门二pandas入门三数据整形数据透视时间序列cat.categories 按某一列重新编码分类数据可视化数据载入与保存实例:MovieLens 电影数据分析一实例:MovieLens 电影数据分析二pandas 核心数据结构一SeriesD...原创 2019-09-19 21:57:59 · 878 阅读 · 0 评论 -
机器学习---数据科学包---pandas索引
课堂学习笔记机器学习---数据科学包三pandas索引多级索引索引交换多级索引的统计列索引转换为行索引机器学习—数据科学包三pandas索引多级索引a = [['a','a','a','b','b','c','c'],[1,2,3,1,2,2,3]]t = list(zip(*a))toutput:[('a', 1), ('a', 2), ('a', 3), ('b', 1),...原创 2019-11-01 14:05:46 · 96 阅读 · 0 评论