机器学习
Bunkicao
这个作者很懒,什么都没留下…
展开
-
视频多标签分类Conv3D实现
实现流程简要概括:抓取样本videos视频内容切片为frame(每帧或每几帧)Conv3D神经网络(视频信息嵌入)全连层 sigmoid+binary CE 多标签分类优点是实现端对端预测,可直接用于下游任务:分类、打标等等缺点是未考虑frame的时序信息,切分类结果通常较general,且依赖大量样本1. Frame 提取方式import cv2import numpy as npimport osdef mkdir(path): folder = os.path.ex原创 2020-06-03 17:29:08 · 1637 阅读 · 3 评论 -
使用Bert获得句向量,用于下游任务
处理文本分类任务时,除了语义信息可能还可以使用一些其他结构化特征(如语料来源,说话人信息等等)。此时可以使用Bert获取原始语料的句向量,再结合已知的结构化特征,训练适用于下游任务的分类器。1. 微调Bert预训练模型见 https://blog.csdn.net/u011340759/article/details/1063316202. 使用Bert特征抓取接口extract_features.py 改写自己的样本输入函数def read_examples(input_file): """原创 2020-05-25 14:16:49 · 2741 阅读 · 0 评论 -
文本分类:Bert微调并完成下游任务
1. 克隆Bert并获取预训练模型$ git clone https://github.com/google-research/bert.git依赖和环境:Tensorflow-gpu version 1.15 (不建议使用TF2)Python version: 3.7CUDA Version: 10.2预训练模型: https://github.com/google-research/bert2. 改写自己的分类器读写函数run_classifier.pyclass MyProc.原创 2020-05-25 13:57:39 · 2588 阅读 · 2 评论 -
Bert-chinese使用GPU运算
Bert-chinese: 基于Tensorflow 1.15.0,需要安装所有CUDA 10.0 libraries:sudo apt-get install cuda-libraries-10-0原创 2020-05-06 19:37:16 · 1423 阅读 · 0 评论