NiHaoma9876543-CSDN博客

转载计算机组成原理第二章--计算机中数据信息的表示

写这系列博客的目的是方便自己期末复习计算机组成原理，会一点一点更新。-----------------------------------------------------------2.1 进位计数制与数制转换各种进制转换，太简单，略-----------------------------------------------------------2.2 ...

2019-09-25 17:31:00 169

转载 2019/09/13

今天还是继续在做拟合，因为感觉即使精度不高还是可以发论文。但是仔细阅读了其中一篇论文后发现，以四万多份样本为基础的实验精度已经达到了0.25左右的loss。而我这个基于小样本的loss却只有0.5左右的loss，高了将近一倍。所以这条路是走不通了。说说之后的计划。1.先用这个202个样本进行拟合，然后对虚拟数据进行预测，画出效果图，...

2019-09-13 20:27:00 112

转载 2019/09/12

今日完成完成了对于虚拟样本的实验。即以不同虚拟样本占比为横坐标，比较loss和准确度是否有提升。结果：毫无规律可言。在网上继续寻找论文。所幸其上两篇文章里的准确率都不高，甚至可以说是非常的低，给了我非常大的信息和鼓舞。明日目标继续做实验，复验神经网络的泛化能力是否足够，今天似...

2019-09-12 20:28:00 100

转载 2019/09/11

今日完成这是今天最新的拟合结果训练集上的准确率有97%，然而验证集上只有77%。因为我并没有加正则化，只是看看这个网络是否能够过拟合。而今天和老师讨论过后，决定在虚拟样本，即先验知识这方面做一个研究。在这里我们能看到的是，这篇论文中只是阐述了用hint和不用hint的差别，但是并没有细化说多少百分比的hint才是最合适的。所以...

2019-09-11 20:41:00 100

转载 2019/09/10

今日完成针对数据不足的情况，参考了Abu-Mostafa的一篇论文--Financial application of learning from hints文中提到了使用先验知识比如专家知识，创造虚拟样本，以先验知识的形式训练网络。可以看到准确率的确上升了不少，但是其实还并不是很准确，...

2019-09-10 19:32:00 102

转载 2019/09/09

今日完成依然还是不停的调参数调参数。发现了有一点不对劲的地方。如果我把这个地方缩小的一万的范围内的话，这个神经网络就没有办法学习到金额越大惩罚越大的特征，而转为学习一些其他的特征（大概如果选到五万的话是一个比较合适的界限。测试了一下是可以学习到这个特征的。但是准确率并不是很高的...

2019-09-09 20:56:00 68

转载 2019/09/08

今日完成今天早上的时候去和老师讨论了一下。接下来还是要尽量的提高精度。所以选取了在盗窃金额在一万以内的案件，有95例，90例用作训练数据，5例用作验证数据。从图中可以看到训练集的准确率非常非常的高，然而测试集有点不行，主要是因为有一个负的样本出来了，但这应该都不是什么大问题，继续增加验证集的样本数目应该可以减少误差。...

2019-09-08 20:14:00 123

转载 2019/09/07

今日完成今天稍微改了改数据范围，因为昨天那个分布，实在是差的太离谱了。所以今天就只拿了犯罪金额在一万以内的，也就是数据集中的部分来训练。可以看出来分布相似。拿10X10的简单网络测试训练。可以看出误差还行。控制台显示，训练集上的MSE是0.08，验证集上的MSE是0.14，主要是有一个离群点特别大抬上去的。所以整体...

2019-09-07 19:18:00 77

转载 2019/09/06

今日完成今天听了老师的建议之后，回来看了一下测试集和验证集的分布，果不其然，非常的不匹配。可以看到的是，测试集数据大多集中在0-50000，而验证集大金额分布更多，所以我们有理由相信，训练集缺少对大金额数据训练。所以就用train.test.split把数据加在一起之后又分分组。所以就变成这样了。...

2019-09-06 20:39:00 86

转载 2019/09/05

---恢复内容开始---完了，大事不妙，今天才发现我做归一化的时候顺带着把下面一行数据也做了归一化了，我就奇了个怪为什么loss这么小，伤透心了，又得重来。今日完成今天把损失函数换了一下，又换回来了，从MAE又换回来MSE然后呢加了L2正则化的东西到每一层去最重要的是修改了准确度计算的公式一开始我用的是\[{\frac{{{...

2019-09-05 20:17:00 91

转载 2019/09/04

这服务器小崩了一会儿。。。今日完成因为昨天已经看到了有过拟合的倾向了，所以今天先不加正则化的部分，先找最佳模型依然是两层隐层，调正节点参数这是64X64这个是64X32这是32X32这是16X16...

2019-09-04 21:18:00 80

转载 2019/09/03

今日完成主要是环境配置，数据迁移，运行GPU板的tensorflow详情可见我写的另一篇文章https://www.cnblogs.com/I-AM-DUMBASS/p/11452747.html明日计划不出意外，不出意外，仍然是过拟合的。在验证集上的loss function升高速率令人害怕明天再加正则化或者dropout层试一...

2019-09-03 20:45:00 67

转载使用GPU跑Tensorflow代码实录

使用conda创建一个新的虚拟环境输入 conda create -n intelligent-judge python=3.6创建一个python版本为3.6的名字是intelligent-judge的虚拟环境查看显卡信息输入lspci | grep -i vga查看显卡信息很明显是NVIDIA Q...

2019-09-03 20:38:00 929

转载 2019/09/02

今日完成加入了验证集，果不其然过拟合了，在验证集上的loss非常之高，accuracy非常之低。accuracy最高只到百分之50左右，而且我的这个破电脑根本就跑不动了，需要借助学校实验室的GPU（大概）。所以用ssh连接远端的linux系统，在另外一个服务器上跑我的代码。这是用ssh成功连接了另外一个服务器。...

2019-09-02 20:10:00 69

转载 2019/09/01

今日完成完了忘记了在九点之前写了换了架构，换成了256 128的架构，效果还可以，loss function降到4.x了，准确率在训练集上的表现有98%左右，非常的不错了明日计划增加数据样本，增加测试集，测试模型在测试集上的精准率今日体会这个项目应该快要出成果了...

2019-09-01 21:27:00 67

转载 2019/08/31

今日完成完成了tensorborad的可视化部分新增了四十余组crime数据，现在loss function正在训练，稳步下降中，如上图loss可视化所示明日计划继续训练，继续等，看最后的结果，继续收集更多的数据。如果可能的话把代码移植一下，移植到GPU上去跑，这样效率大概会快四五倍数据还需...

2019-08-31 20:22:00 77

转载 2019/08/30

今日完成今天是做的demonstration这一周主要做的是超参数(hyper parameter)搜寻，神经网络架构(architecture)调整，损失函数(loss function)调整使用的架构是两层隐层，每层隐层十个节点拟合效果不好，loss function下不去，最低只能到6，7，降不到0.准确率最高只有76%...

2019-08-30 18:29:00 73

转载 2019/08/29

今日完成调整了神经网络的参数，从两层隐层扩展为三层隐层第一层隐层64个节点第二层隐层32个节点第三层隐层16个节点修改了loss fuction　　　　得到了新一轮的拟合曲线而误差保持在百分之五十七，如果继续进行训练，可以展望结果明...

2019-08-29 20:28:00 74

转载 2019/08/28

今日完成拟合模型，训练结果非常不错，曲线形状大致相似但是误差有一点高，可能是因为没有将概率转换成实际的数据的原因明日计划修改神经网络输出部分，寻找真实误差今日体会拟合过程中非常容易陷入局部最优点，即使使用动量优化方法也得重复使用好几遍才能有一个较好的拟合结果初步判定可能是初值设置有问题，起始点...

2019-08-28 19:34:00 62

转载 2019/08/27

今日完成　　　　学习使用git管理文件　　　　ssh密钥　　　　　　已配对　　　　更改状态明日计划继续学习神经网络相关原理，调整神经网络架构今日体会使用分布式系统git管理文件十分方便使用ssh密钥连接远程仓库和本地仓库，通过git shell命令可以...

2019-08-27 20:16:00 65

转载 2019/08/26

今日完成学习机器学习原理，数学基础明日计划继续学习数学基础，学习欠拟合与过拟合与解决方法，尝试是否能解决模型中出现的问题，提高精度今日感想数学基础非常重要，是优化模型的核心，也许可以用多种方法结合寻找更好的下降方法转载于:https://www.cnblogs.com/I-AM-DUM...

2019-08-26 21:22:00 86

转载 2019/08/25

今日完成手动标注训练集数据，扩大训练及规模明日计划继续增大数据集规模体会枯燥转载于:https://www.cnblogs.com/I-AM-DUMBASS/p/11409199.html...

2019-08-25 20:25:00 56

转载 2019/08/24

今日完成学习优化器的原理，梯度下降的数学公式及原理明日计划继续学习原理，是否能够优化体会难转载于:https://www.cnblogs.com/I-AM-DUMBASS/p/11406075.html...

2019-08-24 21:04:00 77

转载 2019/08/23

今日完成demonstration明日计划学习神经网络原理，寻找优化方法今日体会继续做吧转载于:https://www.cnblogs.com/I-AM-DUMBASS/p/11402343.html...

2019-08-23 20:08:00 63

转载 2019/08/22

今日完成还是找论文，看论文，中文的英文的，资料很少，基本上没有这类型的论文，看到了有关cnn分类案件的，cnn本身就可以做特征提取，在想可以不可以用cnn代替bpnn，这样就省去了特征提取的环节了。还是没有做特征提取，正则表达式或TF-IDF啥的，明天一定写。明日计划写TF-IDF，先尝试用BPNN的方法做一下吧，两种方法其实都可以用，可能CNN做非线性回归...

2019-08-22 21:28:00 72

转载 2019/08/21

今日完成正则表达式，方向还不确定，可能会使用TF-IDF明日计划准备用TF-IDF提取特征试一下效果体会没有人带太难了，方向都不好确定，折腾个信息抽取估计要两个星期转载于:https://www.cnblogs.com/I-AM-DUMBASS/p/11390982.html...

2019-08-21 20:18:00 106

转载 2019/08/20

今日完成确定了新的方向，因为提取的文本信息为强文本信息，所以舍弃掉人工智能的方法提取信息，计划用规则提取信息。正在学习正则表达式，以及构建规则抽取信息。明日计划继续学习正则表达式，继续构建规则。今日体会原本的方向是准备要往机器学习，深度学习走，但是我发邮件咨询了一些老师过后，老师建议我因为要提取的信息都是强语义信息，所以还是用规则抽取比较...

2019-08-20 17:11:00 61

转载智能办案人工智能系统项目简介及计划

系统简介本系统用于辅助法庭判决，及输入文本生成判决结果。运用词向量模型，支持向量机，BP神经网络等方法对输入的文本进行处理，训练系统模型。首先，运用自然语言处理经典方法如词向量模型➕支持向量机训练模型，提取文本特征，用训练好后的模型进行罪名预测，模型包含202个罪名。然后，调用对应罪名的BP神经网络训练好的模型，进行辅助判决，输出罚款金额，刑期等判决。模...

2019-08-19 19:59:00 220

NiHaoma9876543的博客