- 博客(12)
- 资源 (2)
- 收藏
- 关注
原创 使用keras自定义神经网络层
“现在的深度学习无非就是堆神经网络模型”这句话既对也不全对,深度学习能够取得如此大的进步在于神经网络的层数增加。但对模型并不是把别人已经做好的模型在自己的机子上跑一下,或者简单堆叠就可以了,而是要有自己的想法产生自己的改进模型。keras提供了自定义层的编程范式,但是很多书都没有介绍,可能是一般的应用用不到。另一方面效果不一定好,需要有一定的理论功底才能设计新的模型。手头刚好需要设计一个自定义层模型,现将方法记录如下。编程范式...
2020-08-23 16:28:43
1074
1
原创 将bert模型作为keras模块使用
1、为什么要用tranformers 在NLP领域如果不使用SOTA方法,存在诸多缺点,效果难以保障:1、SOTA方法结果优,其模型是各种大牛使用数百张TPU,构造的庞大模型,各种参数得到了调优,其训练效果已经达到NLP领域的巅峰;2、泛化能力强,SOTA方法是在海量级数据集上训练产生的,所以适应范围广泛,其泛化能力很强;3、参数多,模型深度高,例如bert模型使用12层,12个多头注意力机制及768个隐藏单元,多达一亿个参数,其训练集数据多达34亿
2020-08-19 15:28:04
1102
原创 统计学习导论(1)------------一般线性模型介绍
线性模型介绍 线性回归模型是指自变量和因变量之间存在简单线性关系的模型。可以表示为:yi=β0+∑βixi y{_i} ={\beta}{_0} +{\sum{\beta}{_i}x{_i} } yi=β0+∑βixi进一步而言如果将x0设定为1则模型可以化简表示为:yi=∑βixi y{_i} ={\sum{\beta}{_i}x{_i} } yi=∑βixi其中βi称之为系数或参数。上述模型使用矩阵表示为:Y=BXY∈R
2020-08-05 01:37:05
1149
原创 Kipf图神经网络阅读笔记-1
引言 如果一篇论文你觉得有价值那就一定要把它读懂,读一遍不行就读两遍,读两遍不行就读十遍,直到读懂为止。当然,读大神的文章需要有点功底,如果确实读不懂,隔几天第一次,肯定每次读都会有新的认识。人生中没有任何一步路是白走的,也没有一滴汗是白流的。######1、对论文的理解 这篇论文是图神经网络大神kipf的博士毕业论文,这篇论文是由一系列已发表论文构成的,这些论文每一篇都是经典之作,都有划时代的意义,所以大神的脑袋真的是
2020-06-08 11:21:15
1063
原创 编写NLP处理程序的套路学习2-文本相似度度量
1、原理 文本相似度的度量有很多种方法,特定词出现频度,整体文本风格等。本文将使用tf-idf方式,通过cosin相似度度量两个文本的相似度。...
2020-02-26 20:32:51
157
原创 编写NLP处理程序的套路学习1---------命名实体识别的Chanel实现
1、引子 练武之人无论天资再聪明没有师傅的指点,或者武林秘籍都不可能自创一套体系,因此各种武功秘籍成了武林争夺的至宝,大家争破头皮也要挤进名门正派。对于学习自然科学及工程领域,自己如果没有团队,没有师傅耐心的带着学习。自学的东西可能非常零散,即使涉猎范围非常广泛。但是没有系统性的学习难成气候。就像学武术无师无派一样,在这种情况之下,武林秘籍就显得尤为重要了,这个武林秘...
2020-02-25 23:54:03
167
原创 使用python编写opencv程序(2、查看图片各种属性,写入图片)
主要语句:img.shapeimg.copy()cv2.imwrite(fileDir2,img,[int(cv2.IMWRITE_JPEG_QUALITY), 5])1、读取属性可以使用img.shape属性读取到图片的长度及宽度,读出的结果为一个三元数组,其中前两个元素为宽度,最后一个元素为图像模式,其中rgb用数字3来表示。2、图像保存对图像进
2015-04-23 14:40:42
782
原创 使用python编写opencv程序(安装及载入图片)
选择Python学习OPencv的原因: Python使用解释型语言,因此非常适合快速学习,同时Python具有结构松散,外部可用模块较多的优点,使用Python学习Opencv对于初学者来说非常适合。1、如何安装opencv 根据Python版本号,选择下载opencv,解压后到指定文件夹下。将解压后的opencv文件夹下Python2.7/Lib/si
2015-04-23 12:58:42
1938
1
原创 使用IDLE编写Python程序出现汉字横着显示的解决方法(附删除键空格消除)
近日用IDLE编写Python程序,发现写出的程序中所包含的部分汉字横着显示,查阅网页中发现其他编译器中也会出现该状况该状况的解决方法为:打开Python IDLE选择option --> configure IDlE 在面板中选择fonts/tabs活动页面,选择前面没有@的字体即可恢复汉字竖着显示,是不是很简单呀^~^
2015-04-12 11:55:02
8918
3
原创 分治法的递归算法时间复杂度分析
最近看分治法,那我们就一起研究下分治法的时间复杂度吧。分治法是将问题分解为语言问题等价的规模相等的子问题进行求解的过程。因此根据定义可知,如果原问题为A该问题被分解为K个子问题,则子问题应该为A/k。同时当子问题被解决之后,对子问题还应该有一个合并的过程,让子问题被重新归纳为原问题。规范的描述过程应该是:1、原问题为A2、划分子问题A/k3、解决子问题4、归并子问题设解决子
2015-01-22 17:27:35
7262
原创 昨天读《赤裸裸的统计学》
昨天没什么事,(。。。怎么会没什么事)。看了一本书叫做《赤裸裸的统计学》看起来就很诱人,是吧?赤裸裸的,直接让人想起某种片,统计学现在炒的最热的名词了。嗯,我已经看过了。 该书的整体印象是很浅显,但是很深刻,不过要看这本书手边最好准备两样东西,1、纸笔,2、概率论与数理统计全书共计14章:第一章是广告,主要是说统计学是大数据时代最炙手可热的学问,通过识别恐怖分子,SAT考试的效度
2014-12-23 19:27:11
930
原创 穷学生自白:爱情如此奢侈 穷孩子哪有爱的能力
就像蒲公英生来无法选择自己的降落点,我无法选择是降生在头等舱还是荒凉的马路。 我的生活是明码标价的,吃一毛钱的中饭还是10块钱的小炒也会限制我的梦想价格。 我一直为我的自知之明感到庆幸,可自从老马被送到医院的时候起,我突然为我们的青春感到了深深,深深的悲哀。 烤鸡蛋香飘男生宿舍楼 我们宿舍有两个猛男,马志超和马勇。为了区别,年纪大的那个叫老马。马志超就是
2008-03-07 14:45:00
1267
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人