自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 ensemble learning 学习分享:回归问题

文章目录用sklearn构建完整的回归项目收集数据集并选择合适的特征选择度量模型性能的指标选择具体的模型并进行训练线性回归模型:关于KKT条件:用线性回归模型拟合数据集,要求只使用numpy本文是学习开源项目‘ensemble learning’之后的总结。平台使用jupyter notebook。项目链接:https://github.com/datawhalechina/ensemble-learning章节学习视频链接:https://www.bilibili.com/video/BV1Mb4

2021-07-15 19:24:38 221

原创 ensemble learning 学习分享:机器学习的数学基础

文章目录高等数学多元函数的相关概念多元函数的偏导数梯度向/矢量Gradient雅克比矩阵(Jacobian矩阵)海森矩阵(Hessian 矩阵)多元函数下的极值问题(最优化问题)带等式约束的优化问题(拉格朗日乘子法Lagrange Multiplier Method)泰勒公式基于梯度的优化方法--梯度下降法(Python实现举例)基于梯度的优化方法--牛顿迭代法线性代数概率论与数理统计本文是学习开源项目‘hands-on data analysis’之后的总结。平台使用jupyter notebook。

2021-07-13 21:56:01 261 1

转载 P问题、NP问题、NPC问题和NP-hard问题详解

文章目录**时间复杂度**确定性算法与非确定性算法P类问题(Polynomial)-NP问题的子集NP问题(Non-deterministic Polynomial)-NPC问题的子集NPC问题NP难问题**机器学习中的过拟合与N/NP问题**在讲题目中的概念的时候,先介绍涉及到的基本概念。时间复杂度多项式polynomial:类似于axn−bxn−1+cax^n-bx^{n-1}+caxn−bxn−1+c这样的式子。对于规模为n的输入,它们在最坏的情况下的运行时间为O(nkn^knk),其中k为某

2021-07-13 09:38:31 4489

原创 Numpy中 tolist() 的用法

ndarray.tolist():将(多维)数组作为(嵌套)列表返回将数组数据的副本作为(嵌套)Python列表返回数据项将转换为最接近的兼容内置Python类型如果ndarray.ndim是0,则返回Python标量原英文释义如下:Return the array as an ndarray.ndim-levels deep nested list ofPython scalarsReturn a copy of the array data as a (nested)Python

2021-07-03 18:01:22 388

原创 numpy.searchsorted:在已排序的数组寻找元素

1. 定义: np.searchsorted(a, v, side='left', sorter=None) 在数组a中插入数组v(并不执行插入操作),返回一个下标列表,这个列表指明了v中对应元素应该插入在a中那个位置上   2. 参数 a : 1-D array_like 输入数组。当sorter参数为None的时候,a必须为升序数组;否则,sorter不能为空,存放a中元素的index,用于反映a数组的升序排列方式。 v : array...

2021-07-01 20:34:05 645

原创 《利用python进行数据分析》第二版 第14章-数据分析示例 学习笔记1

文章目录一、从Bitly获取1.USA.gov数据纯python下对时区进行计数利用pandas对时区进行计数import numpy as npimport pandas as pdimport osimport matplotlib.pyplot as pltfrom numpy.random import randnnp.random.seed(123)一、从Bitly获取1.USA.gov数据2011 年,短服务商Bitly与美国政府网站 USA.gov 合作,提供从以. gov/

2021-06-30 13:55:47 1789

原创 《利用python进行数据分析》第二版 第13章-Python建模库介 学习笔记

文章目录一、pandas与建模代码结合二、用patsy创建模型描述Patsy公式中的数据转换分类数据与Pastsy三、statsmodels介绍评估线性模型评估时间序列处理四、scikit-learn介绍一、pandas与建模代码结合用DataFrame.values属性将DataFrame转换为NumPy数组import pandas as pdimport numpy as npdata = pd.DataFrame({ 'x0': [1, 2, 3, 4, 5], 'x1':

2021-06-28 17:37:26 541

转载 时间序列模型

转自:https://blog.csdn.net/qq_29831163/article/details/89440215时间序列 时间序列预测技术就是通过对预测目标自身时间序列的处理,来研究其变化趋势 的。一个时间序列可以分解为: (1)长期趋势变动。它是指时间序列朝着一定的方向持续上升或下降,或停留在 某一水平上的倾向,它反映了客观事物的主要变化趋势。 (2)季节变动。 (3)循环变动。通常是指周期为一年以上,由非季节因素引起的涨落起伏波形相 似的波动。 (4)不规则变动。通常它分为突然变动

2021-06-26 19:37:13 106

原创 《利用python进行数据分析》第二版 第11章-时间序列 学习笔记

时间序列文章目录时间序列一、日期和时间数据的类型及工具字符串与datatime间的转换二、时间序列基础索引、选择、子集含有重复索引的时间序列三、日期范围、频率和移位生成日期范围频率和日期偏置向前或向后移位日期使用偏置进行移位日期四、时区处理时区的本地化和转换时区感知时间戳对象的操作不同时区间的操作五、时间区间和区间算术区间频率转换季度区间频率将时间戳转换为区间(及逆转换)从数组生成PeriodIndex六、重新采样与频率转换向下采样开端-峰值-谷值-结束(OHLC)重新采样向上采样与差值使用区间进行重新采

2021-06-26 19:17:23 296

原创 《利用python进行数据分析》第二版 第12章-高阶pandas 学习笔记

文章目录一、分类数据背景和目标pandas 中的 Categorical 类型使用 Categorical 对象进行计算分类方法创建用于建模的虚拟变量二、高阶GroupBy应用分组转换和 “展开” GroupBy分组的时间重新采样一、分类数据本节学习 pandas 的 Categorical 类型,学习在使用 pandas 进行某些操作时如何获取更好的性能和内存使用,及一些在统计和机器学习中使用分类数据的工具。背景和目标一个列经常会包含重复值,这些重复值是一个小型的不同值的集合,unique

2021-06-26 18:42:55 249

原创 《利用python进行数据分析》第二版 第10章-数据聚合与分组 学习笔记

文章目录一、Groupby机制可用作分组的键用Series、Series组成的list作为分组键用数组组成的list作为分组键传递列名、列名组成的list作为分组键遍历各分组选择一列/所有列的子集:用列名/列名组成的数组对GroupBy对象进行索引用字典/Series作为分组键用函数作为分组键根据索引层级分组二、数据聚合面向列的多函数应用返回不含行索引的聚合数据三、Apply: General split-apply-combine分位数与桶分析 Quantile and Bucket Analysis示例

2021-06-24 15:56:25 508

原创 Hands-on data analysis学习分享:数据建模与评估

文章目录前言一、 特征工程任务一:缺失值填充任务二:编码分类变量二、模型搭建任务一:切割训练集和测试集提示1任务二:模型创建提示2创建基于线性模型的分类模型(逻辑回归)创建基于树的分类模型(决策树、随机森林)任务三:输出模型预测结果提示3三、模型评估任务一:交叉验证提示4任务二:混淆矩阵提示5任务三:ROC曲线提示6本文是学习开源项目‘hands-on data analysis’之后的总结。平台使用jupyter notebook项目链接:https://github.com/datawhalec

2021-06-22 21:47:15 357

原创 Hands-on data analysis学习分享:数据可视化

本文是学习开源项目‘hands-on data analysis’之后的个人总结——数据可视化简单汇总项目链接:https://github.com/datawhalechina/hands-on-data-analysis数据集下载:https://www.kaggle.com/c/titanic/overview问题1:‘任务二:可视化展示泰坦尼克号数据集中男女中生存人数分布情况(用柱状图试试)。’一开始并没有想到需要用groupby导致走了一些弯路问题2:‘任务三:可视化展示.

2021-06-21 20:57:02 124

原创 Hands-on data analysis学习分享:数据重构

本文是学习开源项目‘hands-on data analysis’之后的个人总结,总结内容为数据清洗及特征处理可执行的操作,如下项目链接:https://github.com/datawhalechina/hands-on-data-analysis数据集下载:https://www.kaggle.com/c/titanic/overview...

2021-06-19 17:47:43 167

原创 Hands-on data analysis学习分享:数据清洗及特征处理

本文是学习开源项目‘hands-on data analysis’之后的个人总结,总结内容为平时学习的查漏补缺及如何着手分析,如下项目链接:https://github.com/datawhalechina/hands-on-data-analysis数据集下载:https://www.kaggle.com/c/titanic/overviewpython操作————————————————版权声明:本文为CSDN博主「KikuWong」的原创文章,遵循CC 4.0 BY-SA版权协议,转.

2021-06-17 17:04:16 225 1

原创 Hands-on data analysis学习分享:数据加载及探索性数据分析

本文是学习开源项目‘hands-on-data-analysis-master’之后的个人总结,总结内容为平时学习的查漏补缺,即没有注意到的点。

2021-06-15 21:32:09 235

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除