自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(37)
  • 收藏
  • 关注

原创 神经网络

神经网络softmax用于计算所属不同目标值的概率损失函数交叉熵损失:Hy′(y)=−∑iyi′log⁡yiH_{y'}(y) = -\sum_iy_i' \log y_iHy′​(y)=−∑i​yi′​logyi​其中y′y'y′代表one-hot编码的真实结果值,yiy_iyi​代表softmax计算得到的概率优化方法反向传播...

2018-10-22 22:50:08 149

原创 k-means算法

非监督学习k:将数据划分为多少个类别过程:1、随即设置k个特征空间内的点作为初始的聚类中心2、对于其他每个点计算到k个中心的距离,未知的点选择最近的一个聚类中心点作为标记分类3、接着对着标记的聚类中心之后,重新计算出每个聚类的新中心点(平均值)4、如果计算得出的新中心点于原中心点一样,那么结束,否则重新进行第二步聚类评估标准:轮廓系数:sci=bi−aimax(bi,ai)sc_...

2018-10-22 15:52:07 143

原创 线性模型

线性模型对于给定d个属性的示例x=(x1;x2;...;xd)x = (x_1;x_2;...;x_d)x=(x1​;x2​;...;xd​)线性模型试图学得一个通过属性线性组合来进行预测的函数f(x)=w1x1+w2x2+w3x3+...+wdxd+bf(x) = w_1x_1+w_2x_2+w_3x_3+...+w_dx_d+bf(x)=w1​x1​+w2​x2​+w3​x3​+...+w...

2018-10-20 11:18:06 217

原创 模型评估与选择

过拟合学习能力过于强大,以至于把训练样本所包含的不太一般的特性都学到了欠拟合学习能力低下,不能准确的根据特性分类。泛化误差学习器在新样本上的误差训练误差学习期在训练集上的误差评估方法留出法将数据集划分为两个部分,一部分当成训练集,另一部分当成测试集交叉验证法将数据集D划分为k个大小相似的子集每次将k-1个子集当成训练集余下的子集当成测试集自助法对于包含m个样本的数据集...

2018-10-20 09:16:15 134

原创 分类算法

分类算法k近邻算法通过样本距离进行分类,取最近邻的k个数据数据集需要标准化朴素贝叶斯算法在特征独立的情况下进行分类算法:P(C∣W)=P(W∣C)P(C)P(W)P(C|W) = \frac{P(W|C)P(C)}{P(W)}P(C∣W)=P(W)P(W∣C)P(C)​W为给定文档的特征值,C为文档类别P(C)P(C)P(C)文档出现的概率P(W)P(W)P(W) 每个特征出现的...

2018-10-20 08:36:16 226

原创 数据库

三范式;第一范式(1NF):列不可拆分第二范式(2NF):唯一标识第三范式(3NF):引用主键spark直接对内存进行操作mapreduce对硬盘进行操作所以spark更高效...

2018-10-19 09:16:41 92 1

原创 数据的降维

方式:1、特征选择:主要方法:Filter(过滤式):VarianceThresholdEmbedded(嵌入式):正则化、决策树Wrapper(包裹式)Filter:删除低方差的特征。2、主成分分析:PCA:特征数量达到上百个时,使数据维数压缩,尽可能降低原数据的维数。当数据特征较多时,特征之间可能是相关的。...

2018-10-09 16:57:45 142

原创 特征预处理

概念:通过特定的统计方法姜数据转换为算法要求的数据方法:sklearn特征处理APIsklearn.preprocessing归一化:通过最大值和最小值对数据进行处理将数据转换为[0,1]之间的数,使得所有特征所占比例大致相同。缺点:对于异常点的处理不好,最大值最小容易受异常点影响(鲁棒性较差)标准化:通过平均值标准差对数据进行处理,将数据转换为平均值为0, 标准差为1 的数据。...

2018-10-09 15:49:59 449

原创 爬虫

网页三大特征:每个网页都有自己的url来定位网页都是用HTML来描述页面信息网页都是用HTTP/HTTPS鞋业来传输HTML数据爬虫的设计思路: 1.确定需要爬取的网页url地址 2.通过HTTP/HTTPS鞋业来获取对应的HTML页面 3。提取HTML页面里有用的数据为什么选择Python做爬虫:PHP:虽然是世界上最好的语言,但是对多线程、异步支持不好,并...

2018-09-12 12:31:44 220

原创 网络

socket模块:用于网络通信 udp协议:快但不稳定

2018-08-29 15:06:00 125

原创 python垃圾回收

小整数常量池 python对[-5,256]内的整数是提前创建好的,不会被垃圾回收。同样大部分的字符串也是如此(不包含特殊符号) Garbage Collection(GC回收机制)

2018-08-28 09:48:45 133

原创 python类的特殊方法

特殊属性: __slots__限定类,不能自由添加属性 __metaclass__:用特定方式来创建类def upper_attr(future_class_name,future_class_parents,future_class_attr): newAttr = {} for name,value in future_class_attr.items(): ...

2018-08-26 21:56:36 269

原创 生成器

In [6]: def test(): ...: i = 0 ...: while i < 5: ...: temp = yield i #通过send对temp赋值 ...: print(temp) ...: i += 1 ...:In [7]: t = test()In [8]:...

2018-08-26 20:28:04 97

原创 python property

class Money(): def __init__(self): self.__num = 100 @property def num(self): print("...getter.....") return self.__num @num.setter def num(self,nu...

2018-08-23 15:49:18 112

原创 深拷贝、浅拷贝

a = [11,22,33]b = [44,55]c = a #浅拷贝a is c #Truea == c #Trued = [11,22,33]a is d #Falsea == d #Trueimport copye = copy.deepcopy(a)#深拷贝另外开辟一段地址e is a #Falsef = [a,d]g = copy.deepcopy(f)f[0]...

2018-08-23 15:37:31 112

原创 java第五天

集合与数组数组的长度是固定的,当超过数组的长度时,需要对数组重新定义,太麻烦,java内部提供了集合类,能存储任意对象,长度是可以改变的,随着元素的增加而增加 数组能存储基本数据类型和引用数据类型,集合只能存储引用数据类型,当存储基本数据类型时会自动装箱。 集合有两个子集合:List、Set List:有序(存和取的顺序一致),有索引,可以存储重复 三个字类: Set 无序,无索引不可以...

2018-08-19 11:42:21 139

原创 java 第四天

包package package语句只能是第一条可执行的代码 四种权限修饰符: private 本类中 默认(什么都不加):本类中、同一包下 protected:本类中、同一包下、不同包下(子类) public:都可用 内部类:在类中定义的类。 调用方法:外部类名.内部类名 对象名 = new 外部类对象.new 内部类对象outer.Inner oi = new oute...

2018-08-16 20:28:00 118

原创 java第四天

多态: 前提:1、要有继承关系。2、要有方法重写。3、要有父类引用指向子类对象。 子类对象在堆区存储时会分配一个空间存储父类(super)的成员class Test{ public static void main(String[] args){ Animal c = new Cat(); c.eat();//cat eat fish! ...

2018-08-07 21:42:39 97

原创 java第三天

java中如果有一个对象没有任何引用指向,那么该对象就会变为垃圾对象,java中有垃圾回收机制,会在不定时对其进行回收。 成员变量与局部变量 成员变量:在类中方法外。在堆内存(成员变量属于对象,对象进堆内存) 局部变量:在方法定义中或者方法声明上。(局部变量属于方法,方法进栈内存。) 生命周期 成员对象:随对象创建而存在,随对象消失而消失。有默认初始化值。 局部变量:随方法调用而存在,...

2018-08-07 11:53:18 113

原创 java第二天

键盘录入:import java.util.Scanner;class Input{ public static void main(String[] args){ Scanner sc = new Scanner(System.in); System.out.println("请输入一个整数"); int x = sc.nextI...

2018-08-05 19:08:37 173

原创 java

一个源文件只能有一个public类 一个源文件可以有多个非public类 源文件的名称应该和public类的类名一致, 如果一个类定义在某个包中,那么package语句应该在源文件的首行 如果源文件包含import语句,那么应该放在package语句和类定义之间。如果没有package语句,那么import语句应该放在源文件中最前面 import语句对源文件中定义的所有类都有效,在同一源...

2018-08-04 13:33:52 199

原创 tensorflow

损失函数loss:预测值(y)与已知答案(y_)的差距 NN优化目标:loss最小 常用的标志方法:均方误差(MSE):MSE(y,y)=∑ni=1(y−y_)2/nMSE(y,y)=∑i=1n(y−y_)2/nMSE(y_,y)=\sum_{i=1}^n (y-y\_)^2/n 代码实现为:loss_mse = tf.reduce_mean(tf.square(y_-y)) 也可以自定义...

2018-08-02 21:51:48 167

原创 计算机基础

计算机只能识别机器语言(0,1序列) 汇编语言:符号表示 汇编程序将汇编语言转换为机器语言,与具体的机器结构有关,不可移植性。 高级语言:与具体机器结构无关,一条语句包含多条指令,面向算法描述,有面向对象和面向过程的语言之分。 处理逻辑分为三种结构: 顺序结构、选择结构、循环结构 将高级语言转换为机器语言两种方式: “编译”和“解释” 1、编译程序:将高级语言源程序转换为机器级目标程序...

2018-07-28 20:39:09 226

原创 Higgs mechanism

it can describe systems where the equations of motion or the Lagrangian obey symmetries, but the lowest-energy vacuum solutions do not exhibit that same symmetry. One important consequence of ...

2018-07-28 16:51:05 173

原创 死亡

人类为什么会死亡,生物为什么会死亡,细胞为什么会死亡?这些问题看似理所当然,实际在背后都隐藏着一些重大的生命学意义。 在这么久的生命演化过程中为什么死亡能够一代代的继承下来,为什么自然选择没有消灭掉死亡这一看似对生命具有诸多弊端的因素,这说明死亡对于生命是有好处的。 有一种观点表明细胞的死亡可能来源于‘细胞分化’——当遇到环境中微妙的化学成分差异时,细胞就会按照不同的方式发育。比如,很多藻类在...

2018-06-03 17:39:49 141

原创 实空间平均场

H=H0+HB+HIH=H0+HB+HIH = H_0+H_B+H_I H0=∑i,jJx(f+ij+fij)(f+i+1,j+1−fi+1,j+1)+Jy(f+ij+fij)(f+i+1,j−fi+1,j)+σJz(2f+ijfij−1)H0=∑i,jJx(fij++fij)(fi+1,j+1+−fi+1,j+1)+Jy(fij++fij)(fi+1,j+−fi+1,j)+σJz(2fij+f...

2018-05-23 16:14:49 261

原创 自旋液体

自旋液体态: 一种具有自旋旋转对称性、每个单位晶胞有奇数个电子的绝缘体(一般具有奇数个电子是金属) 特性:自旋液体激发态总是带有分数量子数的,甚至是分数统计不同的自旋液体不能有其对称性加以区分有能隙自旋液体的基态总具有与任何对称性都无关的拓扑简并性自旋液体总含有某种类型的规范涨落PSG: 投影对称群是对称群的一个扩张,可以对所有平均场相分类,只有当相应的平均场态稳定时,投...

2018-05-17 14:39:13 1281

原创 正则表达式

符号 说明 实例 * 表示任何除了\n\d单一字符 [] 字符集,对单个字符给出取值范围 [abc]表示a,b,c中某一个,[a-z]表示所有小写字母 [^] 非字符集,对单个字符给出排除范围 [^abc]表示非a、b、c的单个字符 * 前一个字符的大于或等于0次 abc*表示ab、abc、abcc等 + 表示

2018-01-31 21:28:44 99

原创 数据结构与算法

线性结构: 又同类型数据元素构成的有序序列的线性结构 第一个数据无前驱,最后一个元素无后继,其他元素一个前驱,一个后继 线性结构的存储有两种方式顺序结构:需要提前分配空间,便于查找链式结构:不需要提前分配,便于删除,插入`栈:FILO:first in last out在顶端进行插入,删除 队列:FIFO:first in first out:一段入队,一段出队 树形

2018-01-30 19:22:36 98

原创 python pillow+pytesseract识别二维码

from selenium import webdriverfrom PIL import Imageimport pytesseractdriver=webdriver.Chrome()url='http://cer.nju.edu.cn/amserver/UI/Login?goto=http%3A%2F%2Fpyb.nju.edu.cn%2Floginredirect.action&

2018-01-29 19:01:06 785 1

原创 算法导论

sort: insertion sort (插入排序) T(n)=T(n−1)+Θ(n)T(n)=T(n-1)+\Theta(n) T(n)=Θ(n2)T(n)=\Theta(n^2)merge sort (归并排序) T(n)=4T(n/2)+Θ(n)T(n)=4T(n/2)+\Theta(n) T(n)=Θ(nlgn)T(n)=\Theta(nlgn)quicksort(快速

2018-01-17 19:44:34 214

原创 结构

使用结构变量可以有组织地把不同类型的数据信息存放在一起,是一种用户自定义的数据类型,关键字未struct。 e.xstruct Employee{ char name[20]; long code; float salary; char address[50]; char phone[11];};int main(){ Employ

2018-01-17 19:44:26 184

原创 文件操作

os: This module provides a portable way of using operating system dependent functionality. os模块:提供了一种方便的使用操作系统函数的方法import os os.remove(name):删除文件os.rename(name):重命名文件nameos.listdir(name):列出指定目

2018-01-17 19:44:15 77

原创 selenium

from selenium import webdriverurl=''driver=webdriver.Chrome()driver.get(url)driver.find_elemen_by_sth('content')sth=: 1.name():通过元素的name属性查找 2.id():通过元素id属性查找 3.tag_name():通过元素标签名称查找 4.cla

2018-01-17 19:42:36 162

原创 numpy(2)

import numpy as npnp.meshgrid(a,b)a,b:1-D arrayreturn coordinate system of vector a,bnp.where()arr=np.arange(5)arr1=np.ones(5)con=arr>3result=[(x if c else y)for x,c,y in zip(arr,con,arr1)]re

2018-01-05 20:57:29 207

原创 numpy学习

import numpy as nparr= np.arange(10)arr[5:8]Out[4]: array([5, 6, 7])arr[5:8]=12arrOut[6]: array([ 0, 1, 2, 3, 4, 12, 12, 12, 8, 9])***ndarray slice***arr2=np.arange(10).reshape(2,5)Out[

2018-01-05 19:11:41 139

原创 drawing flowchart by markdown

tag=>type: content :>urltag is flowchart’s label ,it is the connecting element in the second part,it can be named randomly,generally it consist of abbreviation of word and numbers type used to determ

2018-01-05 09:49:36 385

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除