自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 [数据结构][基础]基本数据结构

数据结构代码优化核心思路数据结构线性表栈队列字符串树哈希表代码优化核心思路时间复杂度优化将代码中的无效计算、无效存储剔除,降低时间复杂度。设计合理数据结构,完成时间复杂度向空间复杂度的转移。空间复杂度优化降低空间复杂度的核心思路就是,能用低复杂度的数据结构能解决问题,就千万不要用高复杂度的数据结构。将代码中的无效计算、无效存储剔除,空间复杂度。常用的分析方法可以参考下面的 3 个步骤:首先,这段代码对数据进行了哪些操作?其次,这些操作中,哪个操作最影响效率,对时间

2021-04-02 12:04:00 479

原创 [计算机][基础]计算机存储

深入计算机存储内存的分类内存的发展内存管理的发展程序的存储硬盘的工作原理电脑的存储一般分为内存和外存。内存一般指(内存储器和主存储器)外存一般指硬盘和可移动的存储内存的分类内存的发展内存管理的发展程序的存储硬盘的工作原理参见回形针的知乎专栏...

2021-03-30 22:44:57 165

原创 [基础][计算机]计算机中的编码

计算机中的数字概念的辨析原反补码的发展及意义补码的深层数学含义概念的辨析原反补码的发展及意义补码的深层数学含义

2021-03-30 22:28:27 114

原创 [其他][阅读技巧]如何阅读一本书

如何阅读一本书

2021-03-30 22:03:50 89

原创 [机器学习][基础算法]SVM

SVMSupport vector machine一般去理解一个算法,都是从名字入手,接触了这么几个算法,这是唯一一个让人捉摸不透的名字.https://onionesquereality.wordpress.com/2009/03/22/why-are-support-vectors-machines-called-so/amp/SVM:from the classifier to...

2020-04-30 23:23:26 283

原创 [Pandas][基础]合并

Pandas合并append与assignappend方法利用序列添加行(必须指定name)用DataFrame添加表assign方法该方法主要用于添加列(Series),列名直接由参数指定可以一次添加多个列df_append.assign(col1=lambda x:x['Height'].mean(), col2=s)combine与updatecomine和u...

2020-04-30 21:23:04 176

原创 [机器学习][基础算法]条件随机场

概率图模型马尔科夫过程(马尔科夫链)定义:假设一个随机过程中,某刻的状态至于前一状态有关,即:P(xn∣x1,x2,...xn−1)=P(xn∣xn−1)P(xn∣x1,x2,...,xn−1)=P(xn∣xn−1)P(x_n|x_1,x_2,...x_{n-1})=P(x_n|x_{n-1})P(xn|x1,x2,...,xn−1)=P(xn|xn−1)P(xn​∣x1​,x2​,.....

2020-04-29 00:11:25 247

原创 [Pandas][基础]变形

Pandas变形透视表pivot:一般状态下,数据在DataFrame会以压缩(stacked)状态存放,例如上面的Gender,两个类别被叠在一列中,pivot函数可将某一列作为新的cols。f.pivot(index='ID',columns='Gender',values='Height').head()[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(im...

2020-04-28 23:41:49 132

原创 [Pandas][基础]分组

Pandas分组SAC过程groupby函数基本内容groupby对象的特点聚合、过滤和变换聚合(Aggregation)过滤(Filteration)变换(Transformation)apply函数SAC过程内涵SAC指的是分组操作中的split-apply-combine过程其中split指基于某一些规则,将数据拆成若干组,apply是指对每一组独立地使用函数,combine指将每...

2020-04-26 23:55:56 149

原创 [机器学习][基础算法]EM算法

EM算法概念EM算法似然函数最大似然估计EM算法公式推导推导逼近证明收敛高斯混合分布理解概念EM算法最大期望算法(Expectation-maximization algorithm,又译为期望最大化算法),是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐性变量。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估...

2020-04-26 23:13:40 213

原创 [机器学习][基础算法]贝叶斯

贝叶斯贝叶斯决策理论贝叶斯公式极大似然估计朴素贝叶斯分类器sklearn参数详解优点缺点:贝叶斯决策理论贝叶斯决策论是概率框架下实施决策的基本方法,对分类任务来说,在所有相关概率都已知的理想情形下,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。贝叶斯公式P(c∣x)=P(x,c)P(x)=P(c)P(x∣c)P(x)P(c|x) = \frac{P(x,c)}{P(x)}...

2020-04-23 23:19:21 216

原创 [pandas][基础]索引

pandas索引loc,iloc,[]切割布尔索引快速标量索引区间索引多级索引设置多级索引多层索引切片索引层的交换索引设定常用索引型函数重复元素处理抽样函数loc,iloc,[]切割loc 方法中都是闭合区间,即包含左右端点loc中能传入的只有布尔列表和索引子集构成的列表iloc方法切片右端点不包含iloc中接收的参数只能为整数或整数列表,不能使用布尔索引[] 左开右闭pd[]...

2020-04-23 21:06:32 229

原创 [机器学习][基础知识]线性回归

线性回归Task1统计学习是关于计算机基于数据构建概率统计模型并利用模型进行预测与分析的一门科学包括监督学习,无监督学习,强化学习,半监督学习,主动学习监督学习的应用分为:分类、标注、回归回归模型时表示从输入变量到输出变量之间映射的函数。一般分为:线性回归和非线性回归机器学习基础知识之线性回归一般形式理论为什么用均方误差?极大似然估计优化方法评价指标程序一般形式f(x)=...

2020-04-21 19:57:37 180

原创 [pandas][基础]Series&DataFrame

pandas 基础学习 dayone checkpandas 基础读取写入读写DataFram & SeriesSeriesDataFrame常用方法问题【问题一】【问题二】【问题三】【问题四】【问题五】练习【练习一】【练习二】读取写入读读取的数据格式是DataFramepandas.read_csv写pandas.to_csv 中index的用法一般设置为index = f...

2020-04-20 23:31:29 231

原创 [天池比赛][0基础]二手车价格预测

模型融合简单加权融合:stacking/blending:boosting/bagging(在xgboost,Adaboost,GBDT中已经用到):Stacking相关理论介绍模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);分类:投票(Voting)...

2020-04-04 19:45:12 277

原创 [天池比赛][0基础]二手车价格预测task4

二手车价格预测task4 checktask4 建模与调参线性回归模型:模型性能验证:嵌入式特征选择:模型对比:模型调参:task4 建模与调参线性回归模型:线性回归对于特征的要求;处理长尾分布;理解线性回归模型;模型性能验证:评价函数与目标函数;交叉验证方法;留一验证方法;针对时间序列问题的验证;不能用未来的数据预测现在的数据绘制学习率曲线;绘制验证曲线;嵌入式特征选...

2020-04-01 21:13:37 183

原创 [天池比赛][0基础]二手车价格预测task3

二手车价格预测task3 checkTask3特征工程Task3特征工程常见的特征工程包括:异常处理:通过箱线图(或 3-Sigma)分析删除异常值;BOX-COX 转换(处理有偏分布);长尾截断;特征归一化/标准化:标准化(转换为标准正态分布);归一化(抓换到 [0,1] 区间);-针对幂律分布,可以采用公式: log(1+x1+median)log(\frac{...

2020-03-27 22:31:31 173

原创 [ML][分类指标]ROC, AUC介绍

常用分类指标简单示例主要参数ROC曲线绘制ROC曲线AUCAUC值的计算AUC的意义Reference简单示例转载自zhwhong简书医学检查结果一般有一下四种情况:真阳性(True Positive, TP)假阳性(False Positive, FP)真阴性(True Negative, TN)假阴性(False Positive, FP)主要参数准确率(Accura...

2020-03-27 19:29:46 984

原创 [天池比赛][0基础]二手车价格预测task1 & task2

[初次体验]天池0基础数据挖掘 task1&task2 checkTask1CSDN Markdown check数据挖掘资料Task2Datawhale 数据挖掘入门练习Task1第一次用CSDN的Markdown编辑器,慢慢习惯。CSDN Markdown check熟悉csdn blog的markdown输入,很简单的语法以及编辑。(除了表格)数据挖掘资料Gituhub ...

2020-03-25 16:52:20 284

原创 [python][库]pip与conda

pandas-profiling相关从pandas-profiling库的安装得知conda与pip都是python 的包管理工具,conda 的图形化软件是anaconda,pip暂未发现图形化软件。conda的包安装不会安装依赖库,pip会。我觉得因此,pip成为了python的官方包管理工具。一个python可以对应一个pip和一个conda都在其bin目录下所以尽量在安装的包的...

2020-03-25 16:43:07 138

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除