2017年12月_Jessica__WEI

原创 Python匹配、检索和替换：match和sub

一、匹配re模块使python语言拥有全部的正则表达式功能。re.match函数尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回none。re.match(pattern,string,flags=0)pattern: 匹配的正则表达式 string: 要匹配的字符串 flags: 标志位，用于控制正则表达式的匹配方式re.s

2017-12-29 11:28:31 1994

原创 Python类与继承

一、面向对象编程的特点类：用来描述具有相同的属性和方法的对象的集合。类定义了该集合中每个对象所共有的属性和方法。实例化：创建一个类的实例，类的具体对象。方法：类中定义的函数。对象：通过类定义的数据结构实例，包括类变量和实例变量两个数据成员和方法。类变量：类变量定义在类中且在函数体之外，通常不作为实例变量使用。实例变量：定义在方法中的变量，只作用于当前实例的类。继承：一个派生类继承基

2017-12-28 12:45:33 1319

原创 Python基本数据类型

Python 3有六种标准数据类型：数字，字符串，列表，元组，集合，字典一、数字 numberpython 3支持 int、float、bool、complex 数值运算符号为：加法（+）、减法（-）、乘法（）、除法（/）、除法（//）、取余（%）、乘方（*）a, b, c, d = 1,2.45,3+4j,trueprint(type(a),type(b),type(c),type(d))

2017-12-14 09:00:13 755

目标：比较不同分类器的性能，以确定在给定的数据集上哪种分类器效果更好。一、估计准确度的置信区间通过将分类任务用二项式试验建模来推导置信区间。给定一个包含N个记录的检验集，令X是被模型正确预测的记录数，p是模型的真正准确率。通过吧预测任务用二项式试验建模，X服从均值为Np、方差为Np(1-p)的二项分布。可以证明经验准确率acc=X/N也是均值为p，方差为p(1-p)/N的二项分布。当N充分大时，通常

2017-12-14 04:53:39 3211

原创分类模型的评估方法

在检验集上计算出的准确率或错误率可以用来比较不同分类器在相同领域上的性能，但需要检验记录的类标号必须已知。一、保持方法(Holdout)将被标记的原始数据划分为两个不相交的集合，分别为训练集和检验集。在训练集上归纳分类模型，在检验集上评估模型的性能。训练集和检验集的划分比例通常根据专家的判断，例如50-50，或者2/3作为训练集，1/3作为检验集。模型的准确率根据模型在检验集上的准

2017-12-14 01:30:19 2941

原创机器学习：模型的过分拟合

一、分类模型的误差1.训练误差(Training error)也称再代入误差(Resubstitution error)或表现误差(Apparent error)，是在训练记录上误分类样本比例2.泛化误差(Generalization error)泛化误差是模型在未知记录上的期望误差二、模型过拟合一个好的分类模型不仅能够很好地拟合训练数据，而且对未知样本也能够准

2017-12-13 03:29:07 7985

原创第一篇博客，写在迷茫无措时

现在是2017年11月30日，一个人在爱城；我是一个CS小白，我要在这个领域立足；我想对你说，我的世界因你而无限可能！

2017-12-01 02:53:08 210

u013402321的博客