自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qwertyuiop0208的博客

原创 Chapter 6 CNN(Convolutional Neural Network)

CNN

2022-09-04 15:54:25 517

原创 Chapter 5 Deep Learning

梯度是个向量那么如何有效得将百万维的向量计算出来，这时候我们就需要使用Backpropagation。

2022-08-31 16:27:52 635

原创 Chapter 4 分类

深度学习——分类问题

2022-08-29 09:03:26 285

原创 Chapter 3 New Optimizers for Deep Learning

New Optimizers for Deep Learning

2022-08-21 11:36:39 200

原创 Chapter 2 Gradient Descent

Gradient Descent

2022-08-18 23:58:52 171

原创 Chapter1 Regression

Regression

2022-08-14 23:31:56 203

原创 Chapter 函数

函数

2022-08-12 21:52:02 166

原创 Chapter 15 HMM模型

HMM

2022-08-09 18:03:11 1006

原创 Chapter 14 主题模型

LDA模型

2022-08-06 23:32:27 560

原创 Chapter 13 贝叶斯网络实践

贝叶斯网络实践

2022-08-06 00:04:29 529

原创 Chapter 12 贝叶斯网络

贝叶斯网络

2022-08-05 00:04:24 1453

原创 Chapter 11 EM算法

EM算法

2022-08-03 09:06:00 236

原创 Chapter 10 聚类

聚类

2022-07-31 23:57:47 321

原创 Chapter 9 SVM实践

SVM实践

2022-07-30 22:35:49 354

原创 Chapter8 支持向量机

支持向量机

2022-07-29 22:45:36 379

原创 Chapter 7 XGBoost

XGBoost

2022-07-29 09:03:05 388

原创 Chapter 6 提升

提升

2022-07-27 22:18:32 398

原创 Chapter 5 决策树和随机森林实践

决策树随机森林

2022-07-26 20:35:47 281

原创 Chapter 4 决策树和随机森林

决策树和随机森林

2022-07-25 16:49:12 199

原创 Chapter 3 回归算法

回归算法

2022-07-24 16:40:07 309

原创 Chapter 2 回归

回归

2022-07-23 16:38:03 303

原创 Chapter1 数据清洗

数据清洗

2022-07-22 15:44:13 450

原创 Chapter 4 用户数据分析

用户数据分析

2022-07-17 00:28:53 240 1

原创 Chapter3美国大选金献项目数据分析

美国大选金献项目数据分析

2022-07-15 21:52:40 169

原创 Chapter 2人口数据分析

人口数据分析

2022-07-15 13:43:32 191

原创 Chapter 8无监督学习

无监督学习

2022-07-14 23:57:53 135

原创 Chapter 7 逻辑回归

逻辑回归

2022-07-14 22:14:35 444

原创 chapter 1 股票数据分析

股票数据分析

2022-07-10 23:14:32 2413

原创 Chapter 6 线性回归、岭回归

线性回归与岭回归

2022-07-09 19:10:01 963

原创 Chapter 5 分类算法——决策树与随机森林

决策树与随机森林

2022-06-22 23:40:20 238

原创 Chapter 4 k-近邻算法与朴素贝叶斯

k-近邻的优缺点（1）k值大小k值取很小：容易受异常点影响k值取很大：容易受最近数据太多导致比例变化（2）优缺点：优点：简单，易于理解，易于实现，无需估计参数，无需训练缺点：懒惰算法，对测试样本分类时的计算量大，内存开销大；必须指定K值，K值选择不当则分类精度不能保证。使用场景：小数据场景，几千～几万样本，具体场景具体业务去测试。k-近邻算法实现：加快搜索速度——基于算法的改进KDTree,API接口里面有实现拉普拉斯平滑系数：问题：从上面的例子我们得到娱乐概率为0，这是不合理的，如果词频

2022-06-22 16:00:50 567

原创 Chpater 3 sklearn数据集与估计器

训练集：75%（推荐）、70%、80%。用于训练，构建模型测试集：25%（推荐）、30%、20%。在模型检验时使用，用于评估模型是否有效sklearn.datasets加载获取流行数据集datasets.load_()获取小规模数据集，数据包含在datasets里datasets.fetch_(data_home=None)获取大规模数据集，需要从网络上下载，函数的第一个参数是data_home，表示数据集下载的目录,默认是 ~/scikit_learn_data/load和fetch返回的数据类型d

2022-06-16 16:31:46 190

原创 Chapter 2 特征工程、机器学习算法

其它特征选择方法神经网络降维案例使用Jupyterps:其他降维方法——线性判别分析LDA监督学习：特征值+目标值分类（目标值离散型）—— k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络回归（目标值连续型）——线性回归、岭回归标注——隐马尔可夫模型 (不做要求)无监督学习：特征值聚类——k-means...

2022-06-15 20:26:32 161

原创 Chapter 1机器学习概述

机器学习是从数据中自动分析获得规律（模型），并利用规律对未知数据进行预测机器学习的数据：文件csvMySQL：1.性能瓶颈、读取速度慢2.格式不太符合机器学习要求的格式pandas：读取工具构成：Kaggle特点：1、大数据竞赛平台 2、80万科学家 3、真实数据 4、数据量巨大UCI特点：1、收录了360个数据集 2、覆盖科学、生活、经济等领域 3、数据量几十万scikit-learn特点：1、数据量较小 2、方便学习特征值+目标值（有些数据集是可以没有目标值的）导入scikit-learn

2022-06-14 20:11:48 223

原创 Chapter 7 树

树树的定义是一个抽象数据类型（ADT）或是作这种抽象数据类型的数据结构，用来模拟具有树状结构性质的数据集合。它由n个有限节点组成一个具有层次关系的集合。树的特点每个节点有零个或者多个子节点。没有父节点的节点称为根节点。每一个非根节点有且只有一个父节点（重要）。除了根节点外，每个子节点可以分为多个不相交的子树。树的术语节点的度——一个节点含有的子树的个数。树的度——一棵树中，最大的节点的度。叶节点或终端节点——度为0的节点。即没有子节点的节点。父亲节点或父节点——若一个节点含有

2022-05-31 17:20:09 802

原创 Chapter 6 希尔排序、快速排序、归并排序、二分查找

希尔排序希尔排序是插入排序的一种，也称缩小增量排序。希尔排序时间复杂度最优时间复杂度:根据步长序列的步长的不同而不同最坏时间复杂度：O(n²)稳定性：不稳定希尔排序算法的实现#coding = utf-8def shell_sort(alist): '''希尔排序''' #n=9 n=len(alist) #gap=4 gap = n//2 #gap变化到0之前，插入算法执行的次数 while gap>=1: #

2022-05-24 12:21:29 250

原创 Chapter 5 冒泡排序、选择排序与插入排序

排序算法的稳定性排序算法——一种能将一串数据依照特定顺序进行排列的一种算法。稳定性——稳定排序算法会让原本有相等键值的记录维持相对次序。冒泡排序冒泡排序的时间复杂度最坏时间复杂度：O(n²)#coding=utf-8def bubble_sort(alist): '''冒泡排序''' n=len(alist) for j in range(0,n-1): #O(n) #走需要进行的次数 for i in range(0,n-1

2022-05-20 22:14:23 180

原创 Chapter 4 双向链表、栈、队列

双向链表（双面链表）对于头结点来说，prev=None对于尾结点来说，next=None关于双链表的操作双链表的判空、长度、遍历操作与单链表相同，见：Chapter 3 单向链表双链表的头部添加、尾部添加、指定位置添加操作#coding=utf-8class Node(object): '''节点''' def __init__(self,elem): self.elem=elem self.next=None #后继

2022-05-18 22:00:18 335

原创 Chapter 3 单向链表

链表的提出为什么需要链表链表结构可以充分利用计算机内存空间，实现灵活的内存动态管理。链表的定义链表——一种常见的基础数据结构，与顺序表统称为线性表，但是不像顺序表一样连续存储数据，而是在每个节点（数据存储单元）里存放下一个节点的位置信息（即地址）。分为数据区和连接区：数据区存放数据，链接区存放下一个数据的地址。如图所示。单链表的ADT模型Python中变量标识的本质变量a是一个存储空间，当a=10时，10也放在另一个存储空间里面，a会指向10的地址。即：等号存在就是引用一个链接。然后a

2022-05-16 22:10:48 268

原创 Chapter 2 顺序表

数字为8个字节，对应4个字节（存储单元）地址也占4个字节顺序表的基本形式两种基本形式：顺序表：存在一组相同的数据类型的数据，最好使用顺序表来存储它们，如图a。元素外置的顺序表若存在的数据各不相同，则会将其地址重新存放到一个循序表中，如图b。图解如下：左侧是顺序表结构，右侧是元素外置的顺序表结构。顺序表的结构与实现顺序表的结构完整信息：表中元素的集合、表头信息（元素存储区的容量、当前表中已有的元素个数）元素存储区的容量——在存储之前设置的容量。顺序表的两种基本实现方式一体式结

2022-05-15 21:07:55 277

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除