- 博客(8)
- 收藏
- 关注
转载 箱体图如何排除异常点
箱形图可以用来观察数据整体的分布情况,利用中位数,25/%分位数,75/%分位数,上边界,下边界等统计量来来描述数据的整体分布情况。通过计算这些统计量,生成一个箱体图,箱体包含了大部分的正常数据,而在箱体上边界和下边界之外的,就是异常数据。其中上下边界的计算公式如下:UpperLimit=Q3+1.5IQR=75%分位数+(75%分位数-25%分位数)*1.5,LowerLimit=Q
2016-11-15 16:27:15 2703
原创 法律裁判文书的统计结果
分析了最近1年的北京民事判决书,top 关键词如下:原告被告公司借款判决诉讼合同上诉证据民法证明利息责任事实规定本案履行约定代理提供审理受理
2016-10-20 17:38:12 928
原创 python中yield的使用
deffab(max): n, a, b =0, 0, 1 whilen max: yieldb # print b a, b =b, a +b n =n +1yield 的作用就是把一个函数变成一个 generator,带有 yield
2016-10-19 15:31:43 308
原创 Alexnet与vggnet的比较
AlexNet 是一种典型的convolutional neural network,它由5层 convolutional layer,2层 fully connected layer,和最后一层label layer (1000个node,每个node代表ImageNet中的一个类别)组成。2012年,deep learning的大牛教授Geoffrey Hinton (Un
2016-10-09 15:59:53 2665
转载 语言模型如何评估
语言模型的性能通常用交叉熵和复杂度(perplexity)来衡量。交叉熵的意义是用该模型对文本识别的难度,或者从压缩的角度来看,每个词平均要用几个位来编码。复杂度的意义是用该模型表示这一文本平均的分支数,其倒数可视为每个词的平均概率。平滑是指对没观察到的N元组合赋予一个概率值,以保证词序列总能通过语言模型得到一个概率值。通常使用的平滑技术有图灵估计、删除插值平滑、Katz平滑和Kneser-Ney
2015-11-30 16:02:17 1150
原创 网络安全--最简单的sql注入
我们平常见到的输入框:如果用户输入:用户名:user1 or '1'='1'密码 : passwd1 or '1'='1'那么,SQl会产生为:select * from ziliao where username=user1 or '1'='1' and password = passwd1 or '1'='1'后面的条件就永远为真,就绕过去
2015-11-10 17:04:42 1074
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人