- 博客(37)
- 收藏
- 关注
原创 神经网络
神经网络softmax用于计算所属不同目标值的概率损失函数交叉熵损失:Hy′(y)=−∑iyi′logyiH_{y'}(y) = -\sum_iy_i' \log y_iHy′(y)=−∑iyi′logyi其中y′y'y′代表one-hot编码的真实结果值,yiy_iyi代表softmax计算得到的概率优化方法反向传播...
2018-10-22 22:50:08 158
原创 k-means算法
非监督学习k:将数据划分为多少个类别过程:1、随即设置k个特征空间内的点作为初始的聚类中心2、对于其他每个点计算到k个中心的距离,未知的点选择最近的一个聚类中心点作为标记分类3、接着对着标记的聚类中心之后,重新计算出每个聚类的新中心点(平均值)4、如果计算得出的新中心点于原中心点一样,那么结束,否则重新进行第二步聚类评估标准:轮廓系数:sci=bi−aimax(bi,ai)sc_...
2018-10-22 15:52:07 155
原创 线性模型
线性模型对于给定d个属性的示例x=(x1;x2;...;xd)x = (x_1;x_2;...;x_d)x=(x1;x2;...;xd)线性模型试图学得一个通过属性线性组合来进行预测的函数f(x)=w1x1+w2x2+w3x3+...+wdxd+bf(x) = w_1x_1+w_2x_2+w_3x_3+...+w_dx_d+bf(x)=w1x1+w2x2+w3x3+...+w...
2018-10-20 11:18:06 229
原创 模型评估与选择
过拟合学习能力过于强大,以至于把训练样本所包含的不太一般的特性都学到了欠拟合学习能力低下,不能准确的根据特性分类。泛化误差学习器在新样本上的误差训练误差学习期在训练集上的误差评估方法留出法将数据集划分为两个部分,一部分当成训练集,另一部分当成测试集交叉验证法将数据集D划分为k个大小相似的子集每次将k-1个子集当成训练集余下的子集当成测试集自助法对于包含m个样本的数据集...
2018-10-20 09:16:15 147
原创 分类算法
分类算法k近邻算法通过样本距离进行分类,取最近邻的k个数据数据集需要标准化朴素贝叶斯算法在特征独立的情况下进行分类算法:P(C∣W)=P(W∣C)P(C)P(W)P(C|W) = \frac{P(W|C)P(C)}{P(W)}P(C∣W)=P(W)P(W∣C)P(C)W为给定文档的特征值,C为文档类别P(C)P(C)P(C)文档出现的概率P(W)P(W)P(W) 每个特征出现的...
2018-10-20 08:36:16 235
原创 数据库
三范式;第一范式(1NF):列不可拆分第二范式(2NF):唯一标识第三范式(3NF):引用主键spark直接对内存进行操作mapreduce对硬盘进行操作所以spark更高效...
2018-10-19 09:16:41 104 1
原创 数据的降维
方式:1、特征选择:主要方法:Filter(过滤式):VarianceThresholdEmbedded(嵌入式):正则化、决策树Wrapper(包裹式)Filter:删除低方差的特征。2、主成分分析:PCA:特征数量达到上百个时,使数据维数压缩,尽可能降低原数据的维数。当数据特征较多时,特征之间可能是相关的。...
2018-10-09 16:57:45 155
原创 特征预处理
概念:通过特定的统计方法姜数据转换为算法要求的数据方法:sklearn特征处理APIsklearn.preprocessing归一化:通过最大值和最小值对数据进行处理将数据转换为[0,1]之间的数,使得所有特征所占比例大致相同。缺点:对于异常点的处理不好,最大值最小容易受异常点影响(鲁棒性较差)标准化:通过平均值标准差对数据进行处理,将数据转换为平均值为0, 标准差为1 的数据。...
2018-10-09 15:49:59 464
原创 爬虫
网页三大特征:每个网页都有自己的url来定位网页都是用HTML来描述页面信息网页都是用HTTP/HTTPS鞋业来传输HTML数据爬虫的设计思路: 1.确定需要爬取的网页url地址 2.通过HTTP/HTTPS鞋业来获取对应的HTML页面 3。提取HTML页面里有用的数据为什么选择Python做爬虫:PHP:虽然是世界上最好的语言,但是对多线程、异步支持不好,并...
2018-09-12 12:31:44 230
原创 python垃圾回收
小整数常量池 python对[-5,256]内的整数是提前创建好的,不会被垃圾回收。同样大部分的字符串也是如此(不包含特殊符号) Garbage Collection(GC回收机制)
2018-08-28 09:48:45 144
原创 python类的特殊方法
特殊属性: __slots__限定类,不能自由添加属性 __metaclass__:用特定方式来创建类def upper_attr(future_class_name,future_class_parents,future_class_attr): newAttr = {} for name,value in future_class_attr.items(): ...
2018-08-26 21:56:36 283
原创 生成器
In [6]: def test(): ...: i = 0 ...: while i < 5: ...: temp = yield i #通过send对temp赋值 ...: print(temp) ...: i += 1 ...:In [7]: t = test()In [8]:...
2018-08-26 20:28:04 103
原创 python property
class Money(): def __init__(self): self.__num = 100 @property def num(self): print("...getter.....") return self.__num @num.setter def num(self,nu...
2018-08-23 15:49:18 120
原创 深拷贝、浅拷贝
a = [11,22,33]b = [44,55]c = a #浅拷贝a is c #Truea == c #Trued = [11,22,33]a is d #Falsea == d #Trueimport copye = copy.deepcopy(a)#深拷贝另外开辟一段地址e is a #Falsef = [a,d]g = copy.deepcopy(f)f[0]...
2018-08-23 15:37:31 120
原创 java第五天
集合与数组数组的长度是固定的,当超过数组的长度时,需要对数组重新定义,太麻烦,java内部提供了集合类,能存储任意对象,长度是可以改变的,随着元素的增加而增加 数组能存储基本数据类型和引用数据类型,集合只能存储引用数据类型,当存储基本数据类型时会自动装箱。 集合有两个子集合:List、Set List:有序(存和取的顺序一致),有索引,可以存储重复 三个字类: Set 无序,无索引不可以...
2018-08-19 11:42:21 144
原创 java 第四天
包package package语句只能是第一条可执行的代码 四种权限修饰符: private 本类中 默认(什么都不加):本类中、同一包下 protected:本类中、同一包下、不同包下(子类) public:都可用 内部类:在类中定义的类。 调用方法:外部类名.内部类名 对象名 = new 外部类对象.new 内部类对象outer.Inner oi = new oute...
2018-08-16 20:28:00 129
原创 java第四天
多态: 前提:1、要有继承关系。2、要有方法重写。3、要有父类引用指向子类对象。 子类对象在堆区存储时会分配一个空间存储父类(super)的成员class Test{ public static void main(String[] args){ Animal c = new Cat(); c.eat();//cat eat fish! ...
2018-08-07 21:42:39 103
原创 java第三天
java中如果有一个对象没有任何引用指向,那么该对象就会变为垃圾对象,java中有垃圾回收机制,会在不定时对其进行回收。 成员变量与局部变量 成员变量:在类中方法外。在堆内存(成员变量属于对象,对象进堆内存) 局部变量:在方法定义中或者方法声明上。(局部变量属于方法,方法进栈内存。) 生命周期 成员对象:随对象创建而存在,随对象消失而消失。有默认初始化值。 局部变量:随方法调用而存在,...
2018-08-07 11:53:18 123
原创 java第二天
键盘录入:import java.util.Scanner;class Input{ public static void main(String[] args){ Scanner sc = new Scanner(System.in); System.out.println("请输入一个整数"); int x = sc.nextI...
2018-08-05 19:08:37 182
原创 java
一个源文件只能有一个public类 一个源文件可以有多个非public类 源文件的名称应该和public类的类名一致, 如果一个类定义在某个包中,那么package语句应该在源文件的首行 如果源文件包含import语句,那么应该放在package语句和类定义之间。如果没有package语句,那么import语句应该放在源文件中最前面 import语句对源文件中定义的所有类都有效,在同一源...
2018-08-04 13:33:52 211
原创 tensorflow
损失函数loss:预测值(y)与已知答案(y_)的差距 NN优化目标:loss最小 常用的标志方法:均方误差(MSE):MSE(y,y)=∑ni=1(y−y_)2/nMSE(y,y)=∑i=1n(y−y_)2/nMSE(y_,y)=\sum_{i=1}^n (y-y\_)^2/n 代码实现为:loss_mse = tf.reduce_mean(tf.square(y_-y)) 也可以自定义...
2018-08-02 21:51:48 170
原创 计算机基础
计算机只能识别机器语言(0,1序列) 汇编语言:符号表示 汇编程序将汇编语言转换为机器语言,与具体的机器结构有关,不可移植性。 高级语言:与具体机器结构无关,一条语句包含多条指令,面向算法描述,有面向对象和面向过程的语言之分。 处理逻辑分为三种结构: 顺序结构、选择结构、循环结构 将高级语言转换为机器语言两种方式: “编译”和“解释” 1、编译程序:将高级语言源程序转换为机器级目标程序...
2018-07-28 20:39:09 237
原创 Higgs mechanism
it can describe systems where the equations of motion or the Lagrangian obey symmetries, but the lowest-energy vacuum solutions do not exhibit that same symmetry. One important consequence of ...
2018-07-28 16:51:05 175
原创 死亡
人类为什么会死亡,生物为什么会死亡,细胞为什么会死亡?这些问题看似理所当然,实际在背后都隐藏着一些重大的生命学意义。 在这么久的生命演化过程中为什么死亡能够一代代的继承下来,为什么自然选择没有消灭掉死亡这一看似对生命具有诸多弊端的因素,这说明死亡对于生命是有好处的。 有一种观点表明细胞的死亡可能来源于‘细胞分化’——当遇到环境中微妙的化学成分差异时,细胞就会按照不同的方式发育。比如,很多藻类在...
2018-06-03 17:39:49 145
原创 实空间平均场
H=H0+HB+HIH=H0+HB+HIH = H_0+H_B+H_I H0=∑i,jJx(f+ij+fij)(f+i+1,j+1−fi+1,j+1)+Jy(f+ij+fij)(f+i+1,j−fi+1,j)+σJz(2f+ijfij−1)H0=∑i,jJx(fij++fij)(fi+1,j+1+−fi+1,j+1)+Jy(fij++fij)(fi+1,j+−fi+1,j)+σJz(2fij+f...
2018-05-23 16:14:49 270
原创 自旋液体
自旋液体态: 一种具有自旋旋转对称性、每个单位晶胞有奇数个电子的绝缘体(一般具有奇数个电子是金属) 特性:自旋液体激发态总是带有分数量子数的,甚至是分数统计不同的自旋液体不能有其对称性加以区分有能隙自旋液体的基态总具有与任何对称性都无关的拓扑简并性自旋液体总含有某种类型的规范涨落PSG: 投影对称群是对称群的一个扩张,可以对所有平均场相分类,只有当相应的平均场态稳定时,投...
2018-05-17 14:39:13 1304
原创 正则表达式
符号 说明 实例 * 表示任何除了\n\d单一字符 [] 字符集,对单个字符给出取值范围 [abc]表示a,b,c中某一个,[a-z]表示所有小写字母 [^] 非字符集,对单个字符给出排除范围 [^abc]表示非a、b、c的单个字符 * 前一个字符的大于或等于0次 abc*表示ab、abc、abcc等 + 表示
2018-01-31 21:28:44 108
原创 数据结构与算法
线性结构: 又同类型数据元素构成的有序序列的线性结构 第一个数据无前驱,最后一个元素无后继,其他元素一个前驱,一个后继 线性结构的存储有两种方式顺序结构:需要提前分配空间,便于查找链式结构:不需要提前分配,便于删除,插入`栈:FILO:first in last out在顶端进行插入,删除 队列:FIFO:first in first out:一段入队,一段出队 树形
2018-01-30 19:22:36 102
原创 python pillow+pytesseract识别二维码
from selenium import webdriverfrom PIL import Imageimport pytesseractdriver=webdriver.Chrome()url='http://cer.nju.edu.cn/amserver/UI/Login?goto=http%3A%2F%2Fpyb.nju.edu.cn%2Floginredirect.action&
2018-01-29 19:01:06 800 1
原创 算法导论
sort: insertion sort (插入排序) T(n)=T(n−1)+Θ(n)T(n)=T(n-1)+\Theta(n) T(n)=Θ(n2)T(n)=\Theta(n^2)merge sort (归并排序) T(n)=4T(n/2)+Θ(n)T(n)=4T(n/2)+\Theta(n) T(n)=Θ(nlgn)T(n)=\Theta(nlgn)quicksort(快速
2018-01-17 19:44:34 221
原创 结构
使用结构变量可以有组织地把不同类型的数据信息存放在一起,是一种用户自定义的数据类型,关键字未struct。 e.xstruct Employee{ char name[20]; long code; float salary; char address[50]; char phone[11];};int main(){ Employ
2018-01-17 19:44:26 190
原创 文件操作
os: This module provides a portable way of using operating system dependent functionality. os模块:提供了一种方便的使用操作系统函数的方法import os os.remove(name):删除文件os.rename(name):重命名文件nameos.listdir(name):列出指定目
2018-01-17 19:44:15 80
原创 selenium
from selenium import webdriverurl=''driver=webdriver.Chrome()driver.get(url)driver.find_elemen_by_sth('content')sth=: 1.name():通过元素的name属性查找 2.id():通过元素id属性查找 3.tag_name():通过元素标签名称查找 4.cla
2018-01-17 19:42:36 174
原创 numpy(2)
import numpy as npnp.meshgrid(a,b)a,b:1-D arrayreturn coordinate system of vector a,bnp.where()arr=np.arange(5)arr1=np.ones(5)con=arr>3result=[(x if c else y)for x,c,y in zip(arr,con,arr1)]re
2018-01-05 20:57:29 218
原创 numpy学习
import numpy as nparr= np.arange(10)arr[5:8]Out[4]: array([5, 6, 7])arr[5:8]=12arrOut[6]: array([ 0, 1, 2, 3, 4, 12, 12, 12, 8, 9])***ndarray slice***arr2=np.arange(10).reshape(2,5)Out[
2018-01-05 19:11:41 145
原创 drawing flowchart by markdown
tag=>type: content :>urltag is flowchart’s label ,it is the connecting element in the second part,it can be named randomly,generally it consist of abbreviation of word and numbers type used to determ
2018-01-05 09:49:36 399
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人