自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 样本不平衡的数据建模——decoupling representation and classifier

decoupling representation and classifier(解耦特征表示模块和分类模块),将原来的分类模型拆分成两部分分别进行训练。比如ResNet-50,一般有神经网络层+分类层(全连接+softmax)构成。以前的模型是对这两部分做联合估计和拟合,但是decoupling representation and classifier是将这两部分分开来估计。来源该方法来自于论文:DECOUPLING REPRESENTATION AND CLASSIFIER FOR LONG-TA

2020-08-22 10:48:32 1489

原创 梯度下降:梯度中心化(gradient centrolization)

来源梯度中心化是来自与论文:Gradient Centralization: A New Optimization Technique for Deep Neural Networks方法对每个batch样本的梯度去中心化。该方法可以适当提高模型的泛化能力,以及提高梯度下降的效率。其理念来源于batchnorm。tensorflow中的应用该方法在tensorflow中的应用代码,我没有找到确切的大牛代码。我自己根据tensorflow的语法写了一个,大家可以作为参考。经本来测试,该方法虽然没有论

2020-08-19 17:58:32 583

原创 NER命名实体识别+bert的医疗实体及事件抽取

NER本质上是一个分类问题。利用bert对文本进行编码,对编码接入全连接或lstm+CRF,接入softmax即可得到每个类别的概率,最大概率对应的类别即为对应字的类别。数据:病例本标签数据(数据在比赛https://www.biendata.com/competition/ccks_2020_2_1/)中,标签一共6类,分别为[‘药物’, ‘实验室检验’, ‘疾病和诊断’, ‘手术’, ‘影像检查’, ‘解剖部位’]。一、bert利用bert预训练模型对文本进行编码。bert模型下载bert模

2020-05-30 23:01:42 6083 14

原创 python selenium 火狐下载文件

注意:1、需要加载 browser.helperApps.neverAsk.saveToDisk 选择,其值 application/x-msdownload 为Mine_type类型。该类型需要在网页上抓包查看(直接通过观察下载文件的类型填入可能会和网页下载的类型不一致),具体是在header中的content type。2、如果出现nss出错,可以设置security.ssl3.dhe...

2018-07-23 16:51:57 757

翻译 python爬虫 selenium+Autolt 实现IE网页中的文件下载

Local $pathToSave=$CmdLine[1]; get the handle of main windowLocal $windHandle= WinGetHandle("[Class:IEFrame]", "")Local $winTitle = "[HANDLE:" & $windHandle & "]"; Select save as optionWinActi...

2018-07-11 14:40:53 3876

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除