自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(82)
  • 收藏
  • 关注

原创 Chapter 6 CNN(Convolutional Neural Network)

CNN

2022-09-04 15:54:25 442 1

原创 Chapter 5 Deep Learning

梯度是个向量那么如何有效得将百万维的向量计算出来,这时候我们就需要使用Backpropagation。

2022-08-31 16:27:52 475

原创 Chapter 4 分类

深度学习——分类问题

2022-08-29 09:03:26 234

原创 Chapter 3 New Optimizers for Deep Learning

New Optimizers for Deep Learning

2022-08-21 11:36:39 142

原创 Chapter 2 Gradient Descent

Gradient Descent

2022-08-18 23:58:52 121

原创 Chapter1 Regression

Regression

2022-08-14 23:31:56 155

原创 Chapter 函数

函数

2022-08-12 21:52:02 130

原创 Chapter 15 HMM模型

HMM

2022-08-09 18:03:11 937

原创 Chapter 14 主题模型

LDA模型

2022-08-06 23:32:27 479

原创 Chapter 13 贝叶斯网络实践

贝叶斯网络实践

2022-08-06 00:04:29 455

原创 Chapter 12 贝叶斯网络

贝叶斯网络

2022-08-05 00:04:24 1347

原创 Chapter 11 EM算法

EM算法

2022-08-03 09:06:00 187

原创 Chapter 10 聚类

聚类

2022-07-31 23:57:47 195

原创 Chapter 9 SVM实践

SVM实践

2022-07-30 22:35:49 293

原创 Chapter8 支持向量机

支持向量机

2022-07-29 22:45:36 288

原创 Chapter 7 XGBoost

XGBoost

2022-07-29 09:03:05 351

原创 Chapter 6 提升

提升

2022-07-27 22:18:32 331

原创 Chapter 5 决策树和随机森林实践

决策树 随机森林

2022-07-26 20:35:47 234

原创 Chapter 4 决策树和随机森林

决策树和随机森林

2022-07-25 16:49:12 154

原创 Chapter 3 回归算法

回归算法

2022-07-24 16:40:07 205

原创 Chapter 2 回归

回归

2022-07-23 16:38:03 244

原创 Chapter1 数据清洗

数据清洗

2022-07-22 15:44:13 388

原创 Chapter 4 用户数据分析

用户数据分析

2022-07-17 00:28:53 193 1

原创 Chapter3美国大选金献项目数据分析

美国大选金献项目数据分析

2022-07-15 21:52:40 134

原创 Chapter 2人口数据分析

人口数据分析

2022-07-15 13:43:32 149

原创 Chapter 8无监督学习

无监督学习

2022-07-14 23:57:53 91

原创 Chapter 7 逻辑回归

逻辑回归

2022-07-14 22:14:35 379

原创 chapter 1 股票数据分析

股票数据分析

2022-07-10 23:14:32 2261

原创 Chapter 6 线性回归、岭回归

线性回归与岭回归

2022-07-09 19:10:01 877

原创 Chapter 5 分类算法——决策树与随机森林

决策树与随机森林

2022-06-22 23:40:20 174

原创 Chapter 4 k-近邻算法与朴素贝叶斯

k-近邻的优缺点(1)k值大小k值取很小:容易受异常点影响k值取很大:容易受最近数据太多导致比例变化(2)优缺点:优点:简单,易于理解,易于实现,无需估计参数,无需训练缺点:懒惰算法,对测试样本分类时的计算量大,内存开销大;必须指定K值,K值选择不当则分类精度不能保证。使用场景:小数据场景,几千~几万样本,具体场景具体业务去测试。k-近邻算法实现:加快搜索速度——基于算法的改进KDTree,API接口里面有实现拉普拉斯平滑系数:问题:从上面的例子我们得到娱乐概率为0,这是不合理的,如果词频

2022-06-22 16:00:50 496

原创 Chpater 3 sklearn数据集与估计器

训练集:75%(推荐)、70%、80%。用于训练,构建模型测试集:25%(推荐)、30%、20%。在模型检验时使用,用于评估模型是否有效sklearn.datasets加载获取流行数据集datasets.load_()获取小规模数据集,数据包含在datasets里datasets.fetch_(data_home=None)获取大规模数据集,需要从网络上下载,函数的第一个参数是data_home,表示数据集下载的目录,默认是 ~/scikit_learn_data/load和fetch返回的数据类型d

2022-06-16 16:31:46 154

原创 Chapter 2 特征工程、机器学习算法

其它特征选择方法神经网络降维案例使用Jupyterps:其他降维方法——线性判别分析LDA监督学习 :特征值+目标值分类(目标值离散型)—— k-近邻算法、贝叶斯分类、决策树与 随机森林、逻辑回归、神经网络回归(目标值连续型)——线性回归、岭回归标注——隐马尔可夫模型 (不做要求)无监督学习:特征值聚类——k-means...

2022-06-15 20:26:32 120

原创 Chapter 1机器学习概述

机器学习是从数据中自动分析获得规律(模型), 并利用规律对未知数据进行预测机器学习的数据:文件csvMySQL:1.性能瓶颈、读取速度慢2.格式不太符合机器学习要求的格式pandas:读取工具构成:Kaggle特点:1、大数据竞赛平台 2、80万科学家 3、真实数据 4、数据量巨大UCI特点:1、收录了360个数据集 2、覆盖科学、生活、经济等领域 3、数据量几十万scikit-learn特点:1、数据量较小 2、方便学习特征值+目标值(有些数据集是可以没有目标值的)导入scikit-learn

2022-06-14 20:11:48 175

原创 Chapter 7 树

树树的定义是一个抽象数据类型(ADT)或是作这种抽象数据类型的数据结构,用来模拟具有树状结构性质的数据集合。它由n个有限节点组成一个具有层次关系的集合。树的特点每个节点有零个或者多个子节点。没有父节点的节点称为根节点。每一个非根节点有且只有一个父节点(重要)。除了根节点外,每个子节点可以分为多个不相交的子树。树的术语节点的度——一个节点含有的子树的个数。树的度——一棵树中,最大的节点的度。叶节点或终端节点——度为0的节点。即没有子节点的节点。父亲节点或父节点——若一个节点含有

2022-05-31 17:20:09 744

原创 Chapter 6 希尔排序、快速排序、归并排序、二分查找

希尔排序希尔排序是插入排序的一种,也称缩小增量排序。希尔排序时间复杂度最优时间复杂度:根据步长序列的步长的不同而不同最坏时间复杂度:O(n²)稳定性:不稳定希尔排序算法的实现#coding = utf-8def shell_sort(alist): '''希尔排序''' #n=9 n=len(alist) #gap=4 gap = n//2 #gap变化到0之前,插入算法执行的次数 while gap>=1: #

2022-05-24 12:21:29 202

原创 Chapter 5 冒泡排序、选择排序与插入排序

排序算法的稳定性排序算法——一种能将一串数据依照特定顺序进行排列的一种算法。稳定性——稳定排序算法会让原本有相等键值的记录维持相对次序。冒泡排序冒泡排序的时间复杂度最坏时间复杂度:O(n²)#coding=utf-8def bubble_sort(alist): '''冒泡排序''' n=len(alist) for j in range(0,n-1): #O(n) #走需要进行的次数 for i in range(0,n-1

2022-05-20 22:14:23 146

原创 Chapter 4 双向链表、栈、队列

双向链表(双面链表)对于头结点来说,prev=None对于尾结点来说,next=None关于双链表的操作双链表的判空、长度、遍历操作与单链表相同,见:Chapter 3 单向链表双链表的头部添加、尾部添加、指定位置添加操作#coding=utf-8class Node(object): '''节点''' def __init__(self,elem): self.elem=elem self.next=None #后继

2022-05-18 22:00:18 256

原创 Chapter 3 单向链表

链表的提出为什么需要链表链表结构可以充分利用计算机内存空间,实现灵活的内存动态管理。链表的定义链表——一种常见的基础数据结构,与顺序表统称为线性表,但是不像顺序表一样连续存储数据,而是在每个节点(数据存储单元)里存放下一个节点的位置信息(即地址)。分为数据区和连接区:数据区存放数据,链接区存放下一个数据的地址。如图所示。单链表的ADT模型Python中变量标识的本质变量a是一个存储空间,当a=10时,10也放在另一个存储空间里面,a会指向10的地址。即:等号存在就是引用一个链接。然后a

2022-05-16 22:10:48 214

原创 Chapter 2 顺序表

数字为8个字节,对应4个字节(存储单元)地址也占4个字节顺序表的基本形式两种基本形式:顺序表:存在一组相同的数据类型的数据,最好使用顺序表来存储它们,如图a。元素外置的顺序表若存在的数据各不相同,则会将其地址重新存放到一个循序表中,如图b。图解如下:左侧是顺序表结构,右侧是元素外置的顺序表结构。顺序表的结构与实现顺序表的结构完整信息:表中元素的集合、表头信息(元素存储区的容量、当前表中已有的元素个数)元素存储区的容量——在存储之前设置的容量。顺序表的两种基本实现方式一体式结

2022-05-15 21:07:55 229

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除