算法
文章平均质量分 83
罗小丰同学
思想的碰撞,让我们更加接近真理!
欢迎小伙伴共同前行:245176275/robbebluecp@gmail.com
展开
-
darknet + yolo3 训练自己的数据集
2018年年中的时候,一不小心接触到了物体检测届的一位佼佼者,一阶段检测框架yolo,于是花了几个月研究并记录下来。直到最近,在工作上要用到物体检测,我第一反应就是yolo3,于是把训练的步骤和过程详细记录下来,给各位分享分享。首先,如果你想用tensorflow版的yolo3去训练,肯定会搜到https://github.com/qqwweee/keras-yolo3这个github的开源...原创 2019-10-17 10:11:23 · 1795 阅读 · 0 评论 -
技术分享-python-sklearn-决策树
决策树是一个很神奇的东西,原理上,只要你这棵树足够大,足够复杂,其准确度可以媲美神经网络。当然,此时过拟合的可能性也非常高了。原理性的东西不多聊了,直接切题。本次技术分享贴主要跟大家分享一下如何在python的sklearn中使用决策树进行数据的训练和预测。(1)首先,大家自行安装sklearn包,此处假设大家都已经有这个包了,我们先导入相关包# tree是建树用的模块,datase...原创 2018-08-27 18:45:08 · 601 阅读 · 0 评论 -
Logistic Regression原理探讨
原创 2018-11-08 11:38:04 · 246 阅读 · 0 评论 -
深入理解 Embedding层的本质
继上文https://blog.csdn.net/weixin_42078618/article/details/82999906探讨了embedding层的降维效果,时隔一个月,分享一下嵌入层在NPL领域的巨大作用。 本文的发表建立在了解文本转向量(如one-hot)的用法的前提上。 首先,继续假设我们有一句话,叫“公主很漂亮”,如果我们使用one-hot编码,可能得到的编码如下...原创 2018-11-26 18:58:43 · 13484 阅读 · 23 评论 -
词句相似度计算——余弦相似度
余弦相似度,是一种通过判断两个向量的夹角来判断其相似性的数学方法。举个栗子:A:中国工商银行北京分部北京支行B:中国招商银行广西分部桂林支行我们用“余弦相似度”的办法来判断这两个句子的相似性1、分词!第一步要做的肯定是分词,把一个句子分成一组一组的散词,分词一般我们会用现成的语料库,比如结巴分词是吧,传说中的最好用的中文分词模块包。如果不是专业性特别强的方向,足矣,如果是专...原创 2019-04-11 17:44:22 · 5927 阅读 · 2 评论 -
一问带你看懂循环神经网络小黑匣内部结构——LSTM
今天给大家分享分享循环神经网络(以LSTM为研究对象)的内部计算逻辑,本次博客从keras源码,并结合一位博主的博客对其进行详细剖析。博客:https://www.cnblogs.com/wangduo/p/6773601.html?utm_source=itdadao&utm_medium=referral,这是一篇非常经典且详细的博客,大家一定要抽时间去过一遍,并仔细思考。探讨之前,假...原创 2019-04-12 16:09:21 · 2534 阅读 · 2 评论 -
keras-bert 分类实战,代码重构
久仰bert大名,终于痛下杀手对bert做一个从肉体到精神上的深入探究和了解在参观了https://github.com/google-research/bert和https://github.com/CyberZHG/keras-bert后,我也决定重写一份keras版本的keras-bert(https://github.com/yfyvan/keras-bert-core),毕竟,是吧...原创 2019-08-15 17:18:58 · 2501 阅读 · 5 评论 -
图像处理——pdf表格处理
最近一直在处理金融方面的数据,其中比较难搞定的是财务报表里面的表格数据。很多非常有用的信息全部浓缩在表格里面,比如如下:这个算是比较规整的、行列整齐的表格。下面的就稍微难一些些:于是,研究了几天,做出了一版基本可用的单元格切割方案。脚本见:https://github.com/yfyvan/table_crop基本思路如下:(1)横竖线定位用的是卷积 ...原创 2019-09-26 11:13:12 · 769 阅读 · 0 评论