自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 pandas练习

练习一import numpy as npimport pandas as pdfrom collections import OrderedDictdf = pd.read_csv('C:/Users/Kingfish/Desktop/joyful-pandas-master/joyful-pandas-master/data/task1.csv')df.head()#(1) 哪...

2020-05-01 23:11:09 460

原创 机器学习-SVM

文章目录SVM理论部分概念:最大超平面数学知识:拉格朗日乘子SVM 硬间隔优化公式SVM 软间隔原理核函数选修 : SMO 求解SVM练习部分代码设计SVM理论部分概念:最大超平面数学知识:拉格朗日乘子SVM 硬间隔优化公式SVM 软间隔原理核函数选修 : SMO 求解SVM练习部分代码设计...

2020-05-01 22:55:59 255

原创 pandas-合并(append与assign、combine与update、concat、merge与join)

文章目录pandas-合并一、append与assign1、append2、assign二、combine与update1、combine2、update三、concat方法四、merge与join1、merge2、join五、练习pandas-合并本文将介绍常用的合并方法,包括append、assign、combine、update、concat、merge、join等。append常用于行...

2020-04-29 21:30:27 1141

原创 pandas-变形

文章目录变形一、透视表1. pivot2. pivot_table3. crosstab(交叉表)二、其他变形方法1. melt2. 压缩stack与展开unstack三、哑变量与因子化1. Dummy Variable(哑变量)2. factorize方法四、练习变形首先加载出需要使用的数据一、透视表1. pivot2. pivot_table3. crosstab(交叉表...

2020-04-28 21:17:20 334

原创 机器学习-条件随机场学习笔记

文章目录条件随机场理论部分前提:相关概念马尔可夫过程隐马尔科夫算法条件随机场转移特征和状态特征矩阵形式条件随机场三问题计算问题学习问题预测问题练习部分利用高维特比算法计算给定输入序列对应的最优输出序列条件随机场理论部分前提:相关概念马尔可夫过程隐马尔科夫算法条件随机场转移特征和状态特征矩阵形式条件随机场三问题计算问题学习问题预测问题练习部分利用高维特比算法计算给定输入序...

2020-04-27 11:56:17 235 1

原创 pandas-分组

文章目录pandas-分组一、SAC过程二、groupby函数1、分组函数的基本内容2. groupby对象的特点三、聚合、过滤和变换1. 聚合(Aggregation)2. 过滤(Filteration)3. 变换(Transformation)四、apply函数1. apply函数的灵活性2. 用apply同时统计多个指标练习pandas-分组一、SAC过程SAC指的是分组操作中的spl...

2020-04-26 23:13:41 760

原创 机器学习-EM算法

文章目录EM算法理论部分相关概念极大似然估计法贝叶斯估计方法EM基本原理E步M步推导、证明高斯混合分布练习部分算法实现EM算法理论部分相关概念极大似然估计法贝叶斯估计方法EM基本原理E步M步推导、证明高斯混合分布练习部分算法实现...

2020-04-26 20:27:23 219

原创 机器学习-朴素贝叶斯

##朴素贝叶斯理论部分相关概念生成模型判别模型朴素贝叶斯基本原理条件概率公式乘法公式全概率公式贝叶斯定理特征条件独立假设后验概率最大化拉普拉斯平滑朴素贝叶斯的三种形式高斯型多项式型伯努利型极值问题情况下的每个类的分类概率下溢问题如何解决零概率问题如何解决sklearn参数详解练习部分利用sklearn解决聚类问题。sklearn.naive_bayes...

2020-04-23 21:19:59 196

原创 pandas-索引

文章目录索引1、单级索引2、多级索引3、索引设定4、常用索引函数5、重复值6、抽样7、具体案例分析索引1、单级索引总结:loc方法、iloc方法、[]操作符最常用的索引方法可能就是这三类,其中iloc表示位置索引,loc表示标签索引,[]也具有很大的便利性,各有特点(a)loc方法(注意:所有在loc中使用的切片全部包含右端点!)小节:本质上说,loc中能传入的只有布尔列表和索引...

2020-04-23 18:15:16 372

原创 机器学习-线性回归

Task01:线性回归(2天)模型建立:线性回归原理、线性回归模型学习策略:线性回归损失函数、代价函数、目标函数算法求解:梯度下降法、牛顿法、拟牛顿法等线性回归的评估指标sklearn参数详解练习部分基于线性回归的房价预测问题利用sklearn解决回归问题sklearn.linear_model.LinearRegression...

2020-04-21 21:09:13 231

原创 Pandas基础

Pandas基础理论部分常见文件格式的读写操作Series 和 DataFrame 的重要属性和重要方法各类排序(索引排序和值排序、单级排序和多级排序)练习部分《权利的游戏》剧本数据集分析科比投篮数据集分析...

2020-04-20 19:18:56 281

原创 Datawhale 零基础入门数据挖掘-Task5 模型融合

模型融合stackingstackingstacking 就是当用初始训练数据学习出若干个基学习器后,将这几个学习器的预测结果作为新的训练集,来学习一个新的学习器。...

2020-04-04 15:57:02 249

原创 Datawhale 零基础入门数据挖掘-Task4 建模调参

文章目录赛题:零基础入门数据挖掘 - 二手车交易价格预测

2020-04-01 21:50:34 239

原创 零基础入门数据挖掘 - 数据的特征工程

文章背景零基础入门数据挖掘 - 二手车交易价格预测本文将进一步对特征进行分析,并对数据进行处理常见的特征工程包括:异常处理:通过箱线图(或 3-Sigma)分析删除异常值;BOX-COX 转换(处理有偏分布);长尾截断;特征归一化/标准化:标准化(转换为标准正态分布);归一化(抓换到 [0,1] 区间);针对幂律分布,可以采用公式:数据分桶:等频分桶;等距分桶;B...

2020-03-27 15:54:12 303

原创 零基础入门数据挖掘 - EDA数据探索性分析

零基础入门数据挖掘 - EDA数据探索性分析文章目录1、载入各种数据科学以及可视化库2、载入数据,简略观察,数据总览3、判断数据缺失和异常4、了解预测值的分布5、特征分析(1) 数值型特征分析相关性分析分布可视化(2)类别型特征分析该部分是在 赛题理解的基础上,进一步的对已有的数据通过作图、制表、方程拟合、计算特征量等手段探索数据,了解数据,了解变量间的相互关系以及变量与预测值之间的存在关...

2020-03-24 11:14:04 372

原创 Datawhale零基础入门数据挖掘-Task1赛题理解

文章目录前言赛题概况数据概况预测指标分析赛题前言Datawhale公号与天池合作组织的一次活动,旨在通过理论+竞赛的形式从0 到1 梳理数据挖掘。作为实战小白,希望在已有的机器学习知识的基础上参与到具体实例中,加强实战动手能力。根据活动组织方的安排,基本学习路径是在对赛题的理解基础上,依次进行数据探索性分析、数据清洗、特征工程、建模调参、模型融合等过程。本文首先对该赛题进行基本的了解,了解赛题...

2020-03-23 15:00:28 290

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除