自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 收藏
  • 关注

转载 Python学习(七)

一、MySQL基础show databases; 查看所有数据库use db_name; 用那个数据库show tables; 查看数据库下的所有表decs table_name; 查看表下的所有字段 等同于 show columns from table_name;select * from tabel_name; sel...

2017-08-26 22:44:00 135

转载 Python学习(六)

一、进程IO操作(例如从端口、硬盘等读数据)不占用CPU,计算操作占用CPU,在线程中来回切换要占用资源,所以python中的多线程不适合计算操作密集型的任务,适合IO操作密集型的任务,对于计算密集型的任务,可以用多进程来解决(对于多核的CPU,对于一个进程下的线程,即使有多个核,同一时间也只有一个核对一个线程进行操作,但多个核可以同时对多个进程进行操作,可以每个核对一个进程下的线程...

2017-08-16 11:22:00 209

转载 Python学习(五)

一、socket基础socket通常被称为“套接字”,用来描述IP地址和端口,是一个通信链的句柄,应用程序通过它向网络发出请求或者应答网络的请求。file模块是对某个指定文件进行打开、读写、关闭,而socket也是一种特殊的文件,一些socket的函数可以对它进行打开、读写、关闭的操作,不同的是socket是针对服务器端和客户端进行的,对于网络接口来说收发数据就相当于读写数据。s...

2017-07-25 17:03:00 116

转载 Python学习(四)

一、类和构造方法class Role(object): # 定义一个类,括号内参数为要继承的父类的名称,object为最顶级的父类,即定义一个类时,必须写object或者其他父类的名称 ac = None # 类变量,只要定义类就存在,是共用的变量,类中的功能要访问这个变量,也必须用self.ac的方法,类变量和实例变量互不影响 def __init__...

2017-07-16 23:56:00 161

转载 机器学习(五)

一、最大间隔分类与SVM模型以下分类面都能把数据分开,但无疑最右边的分类面是最好的,它能对测试样本具有较好的鲁棒性由图可以看出,最右侧样本数据与分类面具有最大的距离,那么怎么保证分类面与训练数据之间有最大间隔呢?这就引出了SVM模型,怎么到的SVM模型?从逻辑回归开始我们已经知道逻辑回归的假设函数和它的图像若分类为y=1,我们想要的理想情况是远远大于0,这样就能...

2017-06-23 17:31:00 200

转载 机器学习(四)

一、评价假设函数我们设计的模型合不合理,得出假设函数是不是具有泛化能力,当假设函数比较复杂,不能够在坐标图上画出是,我们怎么评价?利用验证的方法,把所有收集到的数据随机选取70%作为训练样本,训练模型得到假设函数之后,利用剩余的30%的数据作为测试样本,算出测试样本在假设函数下的误差代价值,如误差代价很小则说明所得到的假设函数具有泛化能力,即具有鲁棒性,例如,线性回归和逻辑回归的测试...

2017-06-22 18:40:00 128

转载 Python学习(三)

一、正则表达式正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。正则表达式有两部分参数,一个是匹配规则pattern,另一个是待匹配的数据源,data_source,用正则表达式时需要导入模块re,import reimport rem...

2017-06-21 12:10:00 178

转载 机器学习(三)

一、神经网络模型对于非线性的数据分布,例如 若用感知器或者逻辑回归的非线性模型,则算特征多项式和权重参数的分数时需要把特征多项式的情况都列举出来,当特征少的时候(例如只有x1,x2)有可能列举出特征组合的所有的特征多项式,但若是特征数很多的情况只算上二次特征多项式的情况,就大约有5000特征项,若算上有三次特征多项式的情况有170...

2017-06-12 19:31:00 92

转载 机器学习(二)

一、感知器 perceptron上节讲到线性回归,输入特征向量,与权重参数对应相乘得到输出的实数结果,但实际中还有选择分类的事情,例如银行要不要给客服发信用卡,发还是不发这是一个分类问题。比如,银行根据一个人的工资、工作年限、负债情况、信用问题等作为特征来判断是不是该给这个客户信用卡,我们来考虑给这些特征设置一些合适的权重,特征与权重乘积得到一个分数,然后设定一个阈值,分数大于阈...

2017-06-09 22:51:00 104

转载 机器学习(一)

一、机器学习介绍什么是机器学习?计算机程序从经验E(给一些样本数据)中学习任务T,用度量P来衡量性能,并且由P定义的关于T的性能会随着经验E而提高机器学习分为:有监督学习(给出数据样本的标签)、无监督学习(没有给出数据样本的标签)、半监督学习(给出少量的有标签数据,和大量没有标签的数据)、强化学习(对输入的数据做出评价)机器学习的过程如下所示:即由训练数据,输入学习算...

2017-06-06 22:05:00 140

转载 Python学习(二)

一、深拷贝和浅拷贝对于数字和字符串而言,赋值、浅拷贝和深拷贝没有意义,永远指向同一个内存地址,其中一个变量的值改变,这个变量会指向其他内存地址,其他的变量指向的内存地址不变,即值不变 1 import copy 2 n1 = 123 3 print(id(n1)) 4 n2 = n1 5 print(id(n2)) 6 n3 = copy.copy(n1)...

2017-06-01 10:59:00 115

转载 机器学习笔记(十二)神经网络

一、神经网络构成人工神经网络模型是仿造生物学的神经元之间的相互连接而成的,相当于很多感知器进行线性组合而成每一个感知器可以做一个线性分类,多个感知器组合可以模拟出平滑的曲线分类对于一个多层的神经网络,前几层可以看做是特征的层层转换,最后一层输出则可以看做一个线性的模型,所以最后一层所学的线性模型都可以用线性模型有对于中间层的神经网络来说,每一层可以看做...

2017-05-31 18:31:00 116

转载 机器学习笔记(十一)集成学习

一、blending和bagging聚合模型(aggregation),就是把得出的不同的假设目标函数进行融合或者联合,从而得到更好的效果一些为blending的分析:,其中为函数g(x)的得票数,可以相同,其中为函数g(x)的条件判断函数,若条件符合则给予的票数,对于已知的,怎么融合起来?,g(x)应该不相同效果才会好,若是相同则融合后的G(x)和g(x)会一样...

2017-05-22 21:07:00 100

转载 机器学习笔记(十)支持向量机SVM

一、最大分类间隔为了保证把数据很好的分开,并且增大对噪声的容忍度,最好是距离分类面的最近分类点,到分类面的距离为最大即求得最大间距的w,并且保证所有点分类正确,还要所有点到分类面的距离和为最小为了计算距离,把w0和x0从特征向量中分离出来,令b=w0,x0=1就去掉了,变为假设已经有了一个最大间隔的分类面,分类面上的点x'和x''有,则x到平面的距离...

2017-05-13 20:36:00 128

转载 Python学习(一)

一、用户交互input 接收用户键盘的输入,为字符串格式(即使输入为数字,也转化为字符串格式)1 name = input("input your name:")2 num = int(input("input your number:"))3 print(name)4 print(num)查看某一功能(例如,字符串、列表、字典、元组等)的功能,利用 ...

2017-05-13 01:18:00 76

转载 机器学习笔记(九)正则化

一、过拟合问题分类模型复杂、数据资料含有噪声、数据量少的情况下能发生过拟合的现象,对于不同的模型复杂度,随着资料量的增大,模型的Ein和Eout变化为:噪声、模型复杂度与数据资料量三者对于过拟合的影响:二、正则化对于较为复杂的模型,需要加入正则化,是高次的项系数权重为0(或接近零),使之变为较低的次方项的模型,以防止过拟合的发生。例如,将Q为10次方的复杂模型...

2017-05-12 22:10:00 79

转载 机器学习笔记(八)非线性变换

一、非线性问题对于线性不可分的数据资料,用线性模型分类,Ein会很大,相应的Ein=Eout的情况下,Eout也会很大,导致模型表现不好,此时应用非线性模型进行分类,例如:分类器模型是一个圆形,假设模型可表示为转化表示形式将平方项和常数项转为一次的Z项,则将非线性的特征空间转化为线性的特征空间可以用线性模型进行分类二、非线性转换对于把Q次方的多项式...

2017-05-11 21:02:00 1013

转载 机器学习笔记(七)线性模型多分类

回顾一下线性分类、线性回归和逻辑回归模型:三个模型的错误恒量为:所以常用逻辑错误恒量来做分类问题,即对于多分类的问题,可以利用逻辑回归训练多个分类器,把其中一个当做一类,其他的作为一类例如:得出是个逻辑回归的软分类器分别输入四个分类器,比较出哪个分类器得出的几率较高,把输入归为相应的类但这种把其中一个作为一类,其他剩...

2017-05-10 20:37:00 228

转载 机器学习笔记(六)逻辑回归

一、逻辑回归问题二分类的问题为是否的问题,由算出的分数值,经过sign函数输出的是(+1,-1),想要输出的结果为一个几率值,则需要改变函数模型,其中,,则逻辑回归的函数为二、逻辑回归错误评价线性分类和线性回归的模型为:其中的线性分数函数均为,逻辑回归有同样的分数函数,模型为逻辑回归的理想函数为对于函数f(x),在数据情况下,D的所有数据在函数下的联合...

2017-05-10 18:52:00 100

转载 机器学习笔记(五)线性回归

一、线性回归问题输入的是特征向量,输出为实数,对于,,模型函数为衡量误差为平方错误,则Ein为,Eout为未来没有看过的数据资料在模型函数上所得的错误二、线性回归算法由Ein可得目的是求得Ein最小,可知在最低点时Ein最小,即梯度为0的时候由,如同,可知其中令,可得输入矩阵X在很少的情况下才是方阵(N=d+1时),在大部分的情况下是可逆...

2017-05-09 20:42:00 117

转载 机器学习笔记(四)机器学习可行性分析

从大量数据中抽取出一些样本,例如,从大量弹珠中随机抽取出一些样本,总的样本中橘色弹珠的比例为,抽取出的样本中橘色弹珠的比例为,这两个比例的值相差很大的几率很小,数学公式表示为:用抽取到的样本作为训练样本集(in-sample),可以求得一个最佳的假设g,该假设最大可能的接近目标函数f,但是在训练样本集之外的其他样本(out-of-sample)中,假设g和目标函数f可能差别很...

2017-05-08 21:55:00 429

转载 机器学习笔记(三)机器学习的种类

一、监督学习知道数据输入的同时还知道数据的标记。就相当于告诉你题目的同时还告诉你答案,让你在这种环境下学习,称之为监督学习。其中这几种类别的硬币已经被各种不同的颜色所标示好。二、无监督学习没有标示(就是没有输出y)的问题,就是不告诉你题目的正确答案让你自己去寻找,最常见的是聚类或者叫分群三、半监督学习通过少量有标记的训练点和大量无标记的训练点达到学习的目的...

2017-05-08 20:16:00 80

转载 机器学习笔记(二)感知器perceptron

一、感知器介绍以银行给用户发信用卡为例:x为用户的特征向量每一维度代表一个特征,例如年龄、收入、工作年限、负债情况等,y为发给信用卡的情况,+1代表发,-1代表不发感知器的模型为以二维特征空间为例:其中 w0 + w1x1 + w2x2 = 0 为二维平面的分割线二、算法实现(Perceptron Learning Algorithm,PLA)...

2017-05-08 19:36:00 157

转载 机器学习笔记(一)机器学习介绍

一、什么是机器学习学习:从观察出发,获得某种有用的技能技能机器学习:通过给数据资料,获得对电脑来说有用的技能,即某种表现的增进机器学习的条件:1.有某种目标,有隐藏的模式、规则可以学习 2.这种模式、规则不能或者不容易写出 3.有相应的资料数据供给二、机器学习的组成从一...

2017-05-08 14:46:00 63

转载 python学习随笔(八)装饰器

1 装饰器:对已经写好的函数进行功能的扩展例如,对函数进行扩展加入验证的功能 1 def login(func): 2 def inner(*args,**kwargs): 3 # 功能1 4 # 功能2 5 # 功能3 6 return func(*args,**kwargs...

2017-04-27 19:14:00 73

转载 python学习随笔(七)迭代器

1 生成一个迭代器sex = iter(['赵','钱','孙','李']) #生成迭代器print(sex)print(sex.__next__()) #读取迭代器内容方法 iter.__next__()sex_1 = sex.__next__()print(sex_1)‘’‘<list_iterator obje...

2017-04-26 23:54:00 66

转载 python学习随笔(六)内置函数 文件操作

一、内置函数不用导入模块,直接可以使用的函数abs() 求绝对值;all() 参数为一个序列,例如:元组,列表,字典,判断序列中的所有值为真,则返回True,否则为False,假的元素:None,空字符串(“”中间没有空格),空列表,空元组,空列表;any() 参数为一个序列,只要序列中的元素有一个为真,就返回True;bin() 返回数字的二进制形式;bool() ...

2017-03-25 00:27:00 66

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除