自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

谢彦的技术博客

静心格物致知

  • 博客(453)
  • 资源 (21)
  • 收藏
  • 关注

原创 敏感性和特异性

敏感性和特异性是医学常用的评价指标。最近找到一个很好的例子来解释它。

2022-12-17 23:11:53 569

原创 读懂英文文章所需的单词量

备考托福,GRE需要背上万单词,除去考试通关的因素,就想看看是不是真有必要花时间去背那么多单词。实验使用从初中到GRE不同等级考试要求的单词表,代入Brown文本数据集,评估背会各等级单词后,能看懂多大比例的文本。比如:高中毕业要求4000左右单词量,背会后对于取自不同领域的各种文本,能看懂句中单词的比例是多少。从实验结果可以看到,即使背会了GRE要求的15000+以上,还会有很多词不认识,如一些专业领域的词汇。当然,如果就认识200个词,那也确实太少了。

2022-11-27 16:45:09 407

原创 部署工具Jenkins

你可以通过Jenkins服务,把github上的更新自动安装部署到指定位置。

2022-11-13 15:00:38 290

原创 论文阅读_深度学习的医疗异常检测综述

主要讨论在医疗数据中使用深度学习方法,以处理影像数据,时间序列为主,同时讨论了医学数据一些特有的属性。

2022-11-13 14:58:59 243 1

原创 论文阅读_深度学习的医疗异常检测综述

主要讨论在医疗数据中使用深度学习方法,以处理影像数据,时间序列为主,同时讨论了医学数据一些特有的属性。

2022-11-13 14:58:15 344 1

原创 论文阅读_基于深度学习的异常检测综述

本篇解读的论文发表于2020年,主要介绍基于深度学习的异常检测技术,可作为2009年发表的那篇高引的传统异常检测综述的互补。

2022-11-13 14:57:00 1043 1

原创 论文阅读_异常检测综述

一篇典型的综述文章,快速了解异常检测的定义,用途,方法……发表时间比较早,是机器学习异常检测方法的总结。正文50多页,比较长。

2022-11-13 14:55:55 409 1

原创 论文阅读_模型剪枝_彩票假设

文章介绍了一种针对图像处理的剪枝算法,不同与以往先训练后剪枝的方法,它的目标是直接训练出一个稀疏的子网络,并使子网络性能与稠密网络性能相当。

2022-10-06 14:02:59 876 1

原创 深度学习模型压缩

对于复杂问题建模时,深度学习模型在容纳更多参数的情况下,效果一般更好,但是模型占内存大,预测时间长的,往往限制其在小型或普通配制的硬件上使用。一般使用模型压缩方法给模型减肥。

2022-09-25 10:15:22 489

原创 EasyNLP简介

EasyNLP中文NLP算法框架

2022-09-25 10:14:05 377

原创 常用线性回归模型

多元线性回归是最常用的预测数值型目标的建模方法,也常用于数据分析中的多因素分析。

2022-09-25 10:13:02 572

原创 论文阅读_知识蒸馏_Meta-KD

结合元学习和蒸馏学习:元学习使得模型获取调整超参数的能力,使其可以在已有知识的基础上快速学习新任务。

2022-09-24 19:11:17 433 1

原创 论文阅读_知识蒸馏_MobileBERT

使用了瓶颈结构,同时微调模型实现加速,最终实现了任务无关的蒸馏BERT模型。

2022-09-24 19:09:21 867 2

原创 论文阅读_知识蒸馏_Distilling_BERT

第一次对大型自然语言模型的蒸馏:将BERT模型蒸馏成BiLSTM模型。

2022-09-24 19:08:09 350 1

原创 论文阅读_知识蒸馏_TinyBERT

对BERT模型进行蒸馏,老师模型和学生模型都使用Transformer架构,但是层数和每层的输出维度可以不同,从而实现对模型的精减。

2022-09-24 19:07:00 392 1

原创 论文阅读_神经网络知识蒸馏_DK

最早提出蒸馏模型的文章,训练老师Teacher/学生Student两个模型。

2022-09-24 19:05:53 383 1

原创 论文阅读_对比学习_SimCSE

主要用于提升句嵌入的质量。方法很简单,利用BERT模型本身的dropout性质,通过同一输入输出不同嵌入作为正例对,然后取同一batch下的反例对训练模型。

2022-09-18 09:41:09 271

原创 论文阅读_自然语言模型加知识图谱_DKPLM

自然语言和知识图结合的一种新尝试,几种优化方法比较有意思。尤其是他对长尾信息的分析,很有启发性:即使在无监督学习的情况下,也要尽量使用重要的数据训练模型。

2022-09-11 16:11:31 377

原创 设置电脑休眠

设置电脑休眠

2022-09-03 20:33:54 231

原创 设置Ubuntu软件源

设置Ubuntu软件源

2022-09-03 20:32:27 389

原创 设置Ubuntu软件源

设置Ubuntu软件源

2022-09-03 18:05:15 380

原创 ubuntu 更新

建议安装 LTS(long term support)版本,比如:16.04, 18.04, 20.04, 22.04,一般大版本为双数,小版本为04。

2022-09-03 18:03:33 543

原创 SHAP解释模型(二)

本文续 "SHAP解析模型" 之后,又尝试了一些SHAP新版本的进阶用法,整理并与大家分享.

2022-08-21 11:14:49 1718 3

原创 论文阅读_广义加性模型_GAMs

加性模型在模型精度和可解释性间取平衡.其核心原理是针对单个特征建立模型,然后把这些模型加在一起形成最终模型.本文描述了具体实现方法.

2022-08-20 16:38:03 698 2

原创 论文阅读_对比学习_SimCLR

对比学习属于自监督学习.自监督学习一般不需要标签,通过数据本身构造模型,训练结果可以支持更多下游任务.

2022-08-14 14:24:20 378

原创 论文阅读_胶囊网络CapsNet

胶囊是一组神经元,其激活向量能表示特定类型的特征,比如一个对象或对象部分。文中用激活向量的长度表示存在的概率,用方向表示参数。

2022-07-31 17:01:59 310

原创 论文阅读_多任务学习_MMoE

多任务学习效果一般取决于不同任务之间的相关性.文中提出的MMoE(Multi-gateMixture-of-Experts)是对之前方法MoE的改进.主要用于解决多任务相关性小时,同时优化多个目标的问题.比如同时预测用户是否购买及用户满意度.在研究过程中,遇到的问题还有如何衡量不同任务的相关性;如果不让模型由于多任务变得过大和过于复杂.文章贡献提出MMoE结构,构建了基于门控的上层网络,模型可自动调节网络参数.设计了生成实验数据的方法,以便更好的衡量任务相关性对建模的影响。...

2022-07-24 19:40:43 412

原创 啥是图神经网络?

图神经网络的算法原理很简单,假设我是一个实体(比如词),利用我的邻居来算我(红色),我的邻居(蓝色)又根据它的邻居计算(这其中也包括我),经过数次反复迭代,直到表示我们的向量逐渐趋于稳定(不再因为迭代而变化),此时就认为找到了合适的编码.比较推荐之前写的。试试说说我的理解,也不一定对从根本上看,它们都是知识表示,文本向量化.通俗地讲就是把文本编码成一串数,文本可能是一个字("生"),一个词("苹果"),一个短语("你说呢")或者一个句子("我是一个句子")…归根结底,它们都是知识的表示,...

2022-07-17 19:46:10 279

原创 论文阅读_医疗NLP_ SMedBERT

提出SMedBERT模型,将知识注入医疗自然语言模型。它使用大规模的医疗数据,同时又融入了知识图中实体连接的语义结构。

2022-07-17 19:44:25 166

原创 2022.06中文NLP阅读列表

2022.06中文NLP阅读列表

2022-07-10 16:21:46 115

原创 论文阅读_ICD编码_BERT

BERT是常用的自然语言处理深度学习模型, BoiBERT和ClinicalBERT是针对医疗领域预训练的模型,文中提出的架构用于将上述模型通过微调解决医疗实体规范化问题.

2022-07-10 15:22:09 200

原创 论文阅读_ICD编码_TLSTM

论文主要挖掘了**ICD编码之间的层级和相关性**,同时还考虑到**人工描述和ICD标准文本**不同的语言风格,一对多的情况下,**多个对应项的重要性排序**,以及**编码的协同和互斥**。

2022-07-10 15:21:00 233

原创 论文阅读_ICD编码_MSATT-KG

很好地结合了现有的资源和方法:利用**编码的内在关系**,结合了注意力机制,**知识图谱**,**密连接网络**等方法。

2022-07-10 15:19:46 202

原创 论文阅读_医疗NLP模型_ EMBERT

针对医疗领域,利用**知识图中的同义词**(只使用了词典,未使用图计算方法),训练类似BERT的自然语言表示模型。优势在于代入了知识,具体设计了**三种自监督学习方法**来捕捉细粒度实体间的关系。...

2022-07-03 13:14:41 303

原创 论文阅读_中文NLP_LTP

基于**Pytorch**的针对**中文**的**离线工具**,带训练好的模型,**最小模型仅164M**。直接支持分词,命名实体识别等六种任务,六种任务基本都围绕分词、确定词的成份、关系。

2022-07-03 13:12:37 302

原创 论文阅读_ICD编码_MSMN

通过代入外部资源UMLS,论文收集了**每个编码的同义词**,从而弥补了电子病历与ICD编码描述中同义不同词的问题。其算法并没有像之前一些模型那么精巧,但引入外部资源后,效果的确提升不少。...

2022-07-02 22:10:21 143

原创 论文阅读_中文医疗模型_ eHealth

目前效果最好的生物医学预训练模型,在 CBLUE 比赛数据上亲测真的有明显提升。

2022-07-02 22:09:10 284

原创 论文阅读_中文NLP_ELECTRA

ELECTRA由Manning联合谷歌发布,后来哈工大讯飞联合实验室训练了相应的中文模型。精减后的模型效果和BERT差不太多,而模型大小只有BERT的1/10,ELECTRA-small 只有46M。

2022-07-02 22:05:21 86

原创 论文阅读_清华ERNIE

2019年前后清华和百度都提出了名为ERNIE的模型,名字相同,方法不同。清华的ERNIE把**知识图融入了文本的向量**表示,也叫KEPLM,想法比较有意思,模型改进效果:**使用少量数据训练模型时,ERNIE比其它模型效果更好**。从技术角度,它示范了**整合异构数据的方法**。...

2022-07-02 22:03:29 173

原创 TFIDF与BM25

TFIDF/BM25算法分析

2022-06-25 14:28:28 217

Android游戏中动画的实现

对于游戏等对界面要求较高的程序,一般需要控制View中的具体图像显示(如动画功能)下面介绍实现此功能常用的SurfaceView控制。

2012-03-06

Android程序中安装其它软件包

应用程序中有时需要调用其它软件,但有时用户没有安装需要调用的软件,为方便用户使用,以下例程实现了半自动化的引导用户安装。

2012-03-06

Android使用DOM方式解析XML

使用Android自带的工具,解析xml文件内容,并显示在程序界面上

2012-03-06

android文件管理器源码

android系统并不自带文件管理器,但是很多情况下,我们有诸如从SD中打开文件的需要. 下面介绍在代码中实现资源管理器,只需要一百行左右的一个类即可以最常用的文件选择功能。本代码为简单的文件管理器的实现,可独立编译执行.

2011-07-06

2010年谢彦的android笔记

原创2010年android文档的整理打包的pdf档(含目录) 文档内容不能复制, 介意者请慎下. 大部分内容可在http://blog.csdn.net/xieyan0811上看到 文档目录如下 1 系统配置 1 1.1 建立SDK开发环境 2 1.2 Android源码的编译 6 1.3 编译在G1上运行的android 2.1(eclair)代码 9 1.4 编译在G1上运行的android 2.2(froyo)代码_旧方法 12 1.5 编译在G1上运行的android 2.2(froyo)代码_新方法 15 1.6 编译在N1上运行的android 2.3(GingerBread)代码 18 1.7 系统结构 21 1.8 模拟器调试与真机调试 22 1.9 安装和卸载应用程序(apk包) 23 1.10 系统升级 26 1.11 android系统支持app2sd(修改boot.img) 27 2 基本概念 30 2.1 Android组件 31 2.1.1 基本组件 31 2.1.2 组件间的通讯 32 2.1.3 intent使用方法 33 2.2 界面开发 35 2.2.1 界面元素 35 2.2.2 布局的实现 36 2.2.3 事件响应 37 2.2.4 应用软件代码结构 38 2.2.5 国际化的支持(多语言) 39 2.2.6 常见问题及解决方法 40 2.2.7 android是重要的包 41 2.3 界面元素分析 42 2.4 修改公共控件 43 2.5 源码中常用于参考的代码 44 3 程序开发 45 3.1 相关工具介绍 46 3.1.1 从c++到java(一) 46 3.1.2 从c++到java(二) 47 3.2 常用技术 49 3.2.1 如何新建和使用控件 49 3.2.2 使用定时器Timer及消息处理 51 3.2.3 操作调试数据库与ContentProvider详解 53 3.2.4 电源管理 56 3.2.5 开发桌面小程序AppWidget 58 3.2.6 代码中运行二进制程序或脚本 60 3.2.7 Android自带的md5校验 61 3.2.8 将数据打进apk包 63 3.2.9 如何改变窗口的标题栏的布局 66 3.2.10 动态改变控件大小 67 3.2.11 缩放drawable 68 3.2.12 解析apk包内容 69 3.3 Java对C库的调用 70 3.3.1 android中使用JNI 70 3.3.2 安装使用NDK 72 3.3.3 在源码中将库打进apk 73 3.3.4 简单的C库调试方法 75 3.4 典型应用 76 3.4.1 语音合成 76 3.4.2 语音识别简介 79 3.4.3 语音识别方法一:使用intent调用语音识别程序 80 3.4.4 语音识别方法二:应用程序自己调用语音识别库 82 3.4.5 语音识别方法三:使用Service调用语音识别程序 84 3.4.6 人脸识别 87 3.4.7 图像识别 89 3.4.8 文字识别 90 3.4.9 卫星定位 91 3.4.10 多媒体播放 95 3.4.11 访问网络 97 3.4.12 博客客户端的实现 99 3.5 调试技术 102 3.5.1 JDWP调试 102 3.5.2 运行dalvik测试程序 103 3.5.3 测试小程序 104 3.5.4 dalvik提供的调试工具集 107 3.5.5 c++程序的调试 110 3.5.6 测试工具CTS 113 3.5.7 解决eclipse无法识别API的问题 115 3.5.8 调试方法补充 116 3.6 换肤(theme) 118 3.6.1 当前的换肤方法(theme) 118 3.6.2 制作换肤包 120 4 android架构层分析 122 4.1 启动过程 123 4.1.1 开机流程 123 4.1.2 开机动画 125 4.1.3 android应用的启动过程 127 4.2 服务的原理与使用 128 4.3 键盘事件处理 130 4.4 包管理 131 4.5 传感器 132 4.6 浅析dalvik虚拟机JIT技术的实现 133 4.7 应用程序的签名(Signature) 135 4.8 应用的权限 138 4.9 屏幕密度Density 140 4.10 Prelink实现的源码分析 142 4.11 适配硬件平台 145 4.12 其他介绍 147 4.12.1 手机保护Keyguard 147 4.12.2 空中升级Fota 148 4.12.3 Flash分区 149

2011-01-18

android将lib库打包成apk安装

将c程序编成动态链接库,在java界面中通过JNI调用它,并能打包成一个apk安装.以下为能在Android源码树中编译的全部例程源码和脚本

2010-11-18

Android使用XML-RPC实现blog客户端源码

能在Android系统中运行的, 使用XML-RPC实现csdn blog客户端(其它blog客户端可以通过修改源码实现),可以独立编译成功的源代码

2010-10-29

MSN博客搬家工具的可执行程序和源码

利用XML-RPC实现的MSN博客搬家工具的可执行程序及JAVA源码下载.代码及使用说明详见http://blog.csdn.net/xieyan0811 (注意:本程序只测试过迁移到CSDN,迁移到其它Blog可能需要修改代码)

2010-10-21

android对文件的MD5验证

能够独立编译运行的android的MD5验证程序

2010-08-31

android访问网络例程

可以独立编译的android访问网络的源码

2010-08-27

android人脸识别

利用android自带的识别库实现人脸识别的小例程,可以在源码中独立编译

2010-08-11

android JNI例程

简单的可以在源码环境中编译的完整android JNI例程

2010-08-10

android多媒体例程

可独立编译的android多媒体例程(可播放本地媒体文件和远程媒体文件)

2010-08-06

android语音合成例程

可以独立编译的android语音合成例程(中/英文)

2010-08-06

android gps例程

完整的android gps例程,可以在源码中编译通过并安装, 可以获得经度纬度及当前捕获的卫星个数

2010-08-05

三个android语音识别例程

三个android识别例程:调用其它程序识别(intent),调用后台服务识别(service),自己识别

2010-08-02

G1(android)刷机文档及工具

android g1刷机文档 介绍了预备知识,备份原始系统,update.zip刷机和fastboot刷机方式

2010-05-06

学习java编程(二)

由于之前都用C/C++写程序,现在改用JAVA写android程序,有些相关的认识和积累,记录下来,自已保存资料,也供大家参考,帮助您在和我遇到同样问题的时候,可以快速解决

2009-10-13

学习java编程(一)

由于之前都用C/C++写程序,现在改用JAVA写android程序,有些相关的认识和积累,记录下来,自已保存资料,也供大家参考,帮助您在和我遇到同样问题的时候,可以快速解决

2009-10-13

Linux例程之二_Debug_显示当前函数调用关系

程序异常退出时,显示当时的函数调用关系 显示当前函数正在被哪个函数调用

2009-04-11

linux例程之一_Debug_规范化打印信息

规范化程序打印信息 打印当前运行程序所对应的源码位置 统计程序运行时间

2009-04-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除