自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

转载 机器学习常用性能度量指标

机器学习常用性能度量指标https://blog.csdn.net/lrs1353281004/article/details/79411552 AUC(Area under Curve):Roc曲线下的面积,介于0.1和1之间。Auc作为数值可以直观的评价分类器的好坏,值越大越好。 https://blog.csdn.net/u013385925/article/details/8038587...

2019-06-30 18:34:41 910

转载 MySQL高效编程

数据库的基本概念 https://blog.csdn.net/small_prince_/article/details/79400912#数据库data-base

2019-06-27 12:46:27 172

原创 八种常用排序算法(python)

常见排序方法的时间与空间复杂度 平均情况时间复杂度 最坏和最好情况是极端情况,发生的概率并不大。为了更有效的表示平均情况下的时间复杂度,引入另一个概念:平均情况时间复杂度,全称叫加权平均时间复杂度或者期望时间复杂度。(引入各自情况发生的概率再具体分析) 多数情况下,我们不需要区分最好、最坏、平均情况时间复杂度。只有同一块代码在不同情况下时间复杂度有量级差距,我们才会区分3种情况,为的是更有效的描...

2019-06-27 08:24:35 352

原创 倾向值分析(协变量选择)

Hirano 和 Imbens 基于预设的临界t值来设定预测变量的方法 1.逻辑回归:逻辑回归虽然带有回归字样,但是逻辑回归属于分类算法。逻辑回归可以进行多分类操作,但由逻辑回归算法本身性质决定其更常用于二分类。 a.逻辑回归公式如下: 其中,Y为决策值,x为特征值,e为自然对数。Y(x)的图形如下: 对于常见二分类,逻辑回归通过一个区间分布进行划分,即如果Y值大于等于0.5,则属于正样本,如...

2019-06-25 15:01:42 8355

原创 字符串

线性表与字符串操作的不同 对于线性表,人们经常考虑的是元素与表的关系、元素的插入和删除。而在考虑字符串时,人们关注的操作不同于一般的线性表,经常需要把字符串作为一个整体使用和处理,考虑许多以整个串为对象的操作。 字符串的相关概念 新知识点:字典序,字符串s1在字符串s2出现的位置,两种特殊子串(前缀和后缀),串s的n次幂,字符串内容的存储 ...

2019-06-24 21:41:52 89

原创 神经网络

1.设计一个神经网络时,输入层与输出层的节点数往往是固定的,中间层则可以自由指定。 2.神经网络结构图中的拓扑与箭头代表着预测过程时数据的流向。 3.结构图里的关键不是圆圈(代表“神经元”),而是连接线(代表“神经元”之间的连接)。每个连接线对应一个不同的权重(其值称为权值),这是需要训练得到的。 4.神经元模型是一个包含输入,输出与计算功能的模型。 5.当我们用“神经元”组成网络以后,描述网络中...

2019-06-24 18:59:22 933

转载 机器学习中防止过拟合的处理方法

过拟合概念 过拟合指的是训练误差小,测试误差大,训练误差和测试误差与模型复杂度的关系如下图所示。 防止过拟合的方法 early stopping、数据集扩增(Data augmentation)、正则化(Regularization)、Dropout Early stopping Early stopping是一种迭代次数截断的方法来防止过拟合的方法,即在模型对训练数据集迭代收敛之前停止迭代来防...

2019-06-24 14:37:46 381

原创 机器学习中的Bias(偏差),Error(误差),和Variance(方差)有什么区别和联系?

偏差与方差的区别: Bias反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度,即算法本身的拟合能力。(训练集) Variance则是“不同的训练数据集训练出的模型”的输出值之间的差异。反应预测的波动情况。(测试集) Overfitting(过拟合),Underfitting(欠拟合) 过拟合:也就是我对训练样本能够百分百命中了,超级拟合了,但是测试时候就掉链子,拟合很差,也就是我们...

2019-06-21 15:43:37 334

转载 python的存储机制

Python是如何进行内存管理的? 答:一对象的引用计数机制,二垃圾回收机制,三内存池机制 一、对象的引用计数机制 Python内部使用引用计数,来保持追踪内存中的对象,所有对象都有引用计数。 引用计数增加的情况: 1,对象被创建:x=4 2,作为容器对象的一个元素:a=[1,x,‘33’] 3,被作为参数传递给函数:foo(x) 引用计数减少的情况: 1,对象的别名被显式的销毁:del x ;或...

2019-06-20 20:12:44 865

转载 利用python实现PSM

1.采用临近匹配法实现倾向值的匹配https://www.jianshu.com/p/34dd19ebe475 注: a. patsy.dmatrices函数,取一个公式字符串和一个数据集(可以使DataFrame或dict),然后为线性模型产生设计矩阵。 https://blog.csdn.net/wuzlun/article/details/80287583 b. 字符串格式化用法:通过’ {...

2019-06-20 15:46:02 5161

原创 python中list, tuple, dictionary, set的底层细节

1.列表实现是基于数组或基于链表结构的。 2.列表和元组的区别是显然的: 列表是动态的,其大小可以该标 (重新分配), 而元组是不可变的,一旦创建就不能修改。 3.字典 a.CPython使用伪随机探测(pseudo-random probing)的散列表(hash table)(哈希表)作为字典的底层数据结构。由于这个实现细节,只有可哈希的对象才能作为字典的键。Python中所有不可变的内置类型...

2019-06-20 09:11:29 873

原创 时间与空间复杂度分析

1.时间复杂度: a.实际上,在大多数情况下,我们并不需要区分最好、最坏、平均情况时间复杂度三种情况。像我们上一节课举的那些例子那样,很多时候,我们使用一个复杂度就可以满足需求了。只有同一块代码在不同的情况下,时间复杂度有量级的差距,我们才会使用这三种复杂度表示法来区分。 b.目标为结合例子说明平均时间复杂度的概念(说明程序,指出将每种情况出现的概率结合考虑) c. 一般情况下,算法中基本操作重复...

2019-06-19 08:54:34 283

原创 Leetcode 136 python 只出现一次的数字

#使用python的异或操作,0异或任何数不变,任何数与自己异或为0。a⊕b⊕a=b。异或满足加法结合律和交换律。 #a ^ b ^ c = a ^ (b ^ c) = (a ^ b) ^ c #https://blog.csdn.net/qq_37002901/article/details/88332489 class Solution: def singleNumber(self, ...

2019-06-11 19:22:45 134

原创 python程序笔记

1.接收输入:a_sequence = [i for i in input().split()] 2.参数定义的顺序必须是:必选参数、默认参数、可变参数、命名关键字参数和关键字参数。 3.堆棋子: #include <bits/stdc++.h> using namespace std; // 计算曼哈顿距离 int manhattan_dist(int x1, int y1,...

2019-06-10 14:08:22 503

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除