自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 Kaggle实践之《Home Credit Default Risk》的逐步优化

记录下每一次的改进及其score。

2024-02-22 01:01:44 450 1

原创 Kaggle实践之《Home Credit Default Risk》的数据源理解

比赛链接如下:https://www.kaggle.com/competitions/home-credit-default-risk/overview该比赛是Home Credit公司拿出他们公司的实际问题设置题目,传统的金融机构需要客户有良好且连续的信用卡使用记录才给贷款,Home Credit想用科技的方法解决这个问题,找到那些有实际还款能力但是被传统金融机构拒绝的客户。本赛题是要预测客户是否会违约,违约的客户会给公司带来实际的经济损失,因为我们要尽量的避免给这部分客户放贷。

2024-02-17 21:01:44 1381

原创 再读《送东阳马生序》

再读《送东阳马生序》,初读不识文中意、再看已是文中人。宋濂这篇文章,把老师喜欢什么样的学生,领导喜欢什么样的人才,穷人家的孩子如何才能走捷径,没资源没背景如何才能有贵人提携,都说透了。

2023-11-19 13:30:23 135

原创 机器学习评价指标

分类模型评价指标简述

2023-11-06 00:26:06 119

原创 机器学习基础篇之逻辑回归模型

Logistic Regression(简称LR)虽然被称为回归,但其实是分类模型,并常用于二分类。LR由于其简单、可并行化、可解释性强深受工业界喜爱,尤其是金融领域。LR模型的本质是:假设数据集服从这个分布,然后用极大似然估计做参数的估计。

2023-10-15 19:32:18 196

原创 深度学习基础篇之Transformer网络

Transformer的大名已经听过很久了,一直没有找到机会详细了解该模型的原理及架构,趁着这次要复习的机会把transformer的原理彻底搞懂。本文参考了沐神在B站的论文讲解以及一些其他人的transformer文章。

2023-08-29 21:36:28 208

原创 深度学习基础篇之长短记忆递归神经网络(LSTM)

在循环神经网络(RNN)模型中,我们总结了RNN模型的优缺点。由于RNN有梯度消失的问题,因此很难处理长序列的数据。于是有人对RNN做了改进,得到了RNN的特例LSTM(Long Short-Term Memory),它可以避免常规RNN的梯度消失问题,因此在工业界得到了广泛的应用。

2023-06-11 00:48:23 539

原创 深度学习基础篇之循环神经网络(RNN)

前面我们讲了DNN,以及DNN的特例CNN的模型及其前向反向传播算法,这些算法都是前向反馈的,模型的输出和模型本身没有关联。今天我们就讨论另一类模型间有反馈的神经网络:循环神经网络(Recurrent Neural Networks,以下简称RNN),它广泛的用于自然语言处理中的语音识别、手写识别及机器翻译等。

2023-06-10 22:48:03 510

原创 机器学习算法综述

1、NLP领域。

2023-05-20 00:51:57 81

原创 经典论文笔记之《Efficient Estimation of Word Representations in Vector Space》

我是是是是是是是。

2023-05-20 00:33:33 139 1

原创 深度学习基础篇之卷积神经网络(CNN)

当然我们也可以灵活搭配各种结构,如卷积层+卷积层、卷积层+卷积层+池化层,这些在构建模型时没有限制。在若干卷积层+池化层后面是全连接层(Fully Connected Layer,简称FC),全连接层实际上就是DNN的结构,输出层采用的是Softmax层做图像的分类。从CNN的结构可以看出,CNN相对于DNN,比较特殊的就是卷积层和池化层,只要把卷积层和池化层的原理搞清楚,那么搞清楚CNN就很容易了。在卷积层后面是池化层(Pooling Layer),这也是CNN特有的网络结构,池化层是没有激活函数的。

2023-05-19 20:38:55 5354

原创 深度学习基础篇之深度神经网络(DNN)

神经网络不应该看做是一个算法,应该看做是一个特征挖掘方法。在实际的业界发展过程中,数据的作用往往大于模型,当我们把数据的隐藏特征提取出来之后,用很简单的模型也能预测的很好。神经网络模型由生物神经中得到启发。在生物神经元细胞中,神经突触接收到信号,经过接收并处理信号后判断信号的信息强弱,来做出不同神经电位变化反应。受此启发,科研人员设计出基础的神经网络模型结构,神经元模型(Neuron Model)。

2023-04-13 00:05:20 17678 1

原创 SQL小技巧

随机选择数据SELECT * FROM table_name order by rand() limit 20;INNER JOIN两个表进行inner join时,对于相同的字段,不论是用左表还是右表,相交的结果都是一样的。SELECT a.column_nameFROM ( SELECT column_name FROM table_a ) aJOIN ( SELECT column_name

2022-03-22 15:43:19 126

原创 CREATE TABLE AS 的执行问题

这里写自定义目录标题CREATE TABLE IF NOT EXISTS 表名 AS SELECT * FROM table_x;在‘表名’不存在的时候会创建该‘表名’并插入数据,当‘表名’存在时不会创建表名,那么会将数据插入到这个已存在的‘表名’中吗?...

2022-01-21 11:42:05 1724

原创 append使用误区

list.append()方法的返回值是None,在使用时不要把list.append赋值给另一个list,这会导致list值为空,append方法会改变原list。 错误使用方式l = []s = 'abcde'for i in s: l = l.append(i)[OUT]:Traceback (most recent call last): File "<ipython-in

2017-01-20 22:14:53 1187

原创 计算机概论

1.计算机的组成计算机其实是接收用户输入指令与数据,经过中央处理器的数据与逻辑单元运算处理后,以产生或存储成有用的信息。计算机硬件的五大单元输入单元:键盘,鼠标,扫描仪等 中央处理器(CPU):含有算术逻辑,控制,记忆单元 输出单元:例如屏幕,打印机等CPU的种类CPU内部含有一个微小的指令集,我们所使用的软件都要经过CPU内部的指令集才能工作。目前常用的两种指令集包括精简指令集和复杂指令集。

2016-08-07 11:27:11 588

原创 朴树贝叶斯法

朴树贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入输出的联合概率分布;然后基于此模型。对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。

2016-07-20 18:18:31 2198

原创 Python中排序常用到的sort 、sorted和argsort函数

Python中sort 和 sorted函数 一、介绍 sort函数是list列表中的函数,而sorted可以对list或者iterator进行排序 二、sort和sorted的比较 1、用sort函数对列表排序时会影响列表本身,而sorted不会 举例:>>> a = [1,2,1,4,3,5] >>> a.sort() >>> a [1, 1, 2, 3, 4, 5]>>

2016-07-18 11:54:42 687

原创 支持向量机

支持向量机是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使他有别于感知机;支持向量机还包括核技巧,这使他成为实质上的非线性分类器。支持向量机的学习策略就是间隔最大化,可形式化为一个求解凸二次规划的问题,也等价于正则化的合页损失函数的最小化问题。支持向量机的学习算法是求解凸二次规划的最优化问题。支持向量机学习方法包括构建由简至繁的模型:线性可分支持向量机,线性支持向量

2016-07-17 21:34:14 938

原创 决策树

决策树是一种基本的分类和回归方法,本文主要讨论用于分类的决策树,在分类问题中,表示基于特征对实例进行分类的过程。决策树可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布,学习时,利用训练数据,根据损失函数最小化原则建立决策树,决策树学习主要包括3个步骤:特征选择,决策树的生成和决策树的修剪。1.特征选择特征选择在于选取对训练数据具有分类能力的特征,这样可以提高决策

2016-07-15 10:55:49 833

原创 Python面向对象

Python和Java都是高级语言,都是面向对象语言,所以Python也有类,继承,多态等特征,下面就介绍Python的面向对象。

2016-06-07 02:27:21 555

原创 Python进阶之函数式编程

何为函数式编程,是一种编程范式,函数-function 函数式-functional,函数式编程支持高阶函数。Python支持的函数式编程有以下特点不是纯函数式编程:允许有变量支持高阶函数:函数也可以作为变量传入支持闭包:有了闭包就能返回函数有限度的支持匿名函数函数名其实是指向函数的变量

2016-06-04 19:04:03 535

原创 Python基础入门

Python基础知识学习,努力学习ing

2016-05-31 00:43:10 815

原创 概率空间与概率分布

σ-代数设为非空集合, 中的元素是  的子集合,满足以下条件的集合系称为上的一个σ代数:在中;如果一个集合在中,那么它的差集也在中;如果有可数个集合都在中,那么它们的联集也在中。用数学语言来表示,就是不借助逻辑符号的话,也可以使用如下更简洁的定义:设为非空集合。则上的一个σ代数是指其幂集的子集合  对有限个差集、交集跟可数个并集这三种

2016-05-14 23:20:34 19419

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除