- 博客(26)
- 收藏
- 关注
原创 中文医疗信息处理评测基准CBLUE
本评测任务为面向中文医学文本的命名实体识别,即给定schema及句子sentence,对于给定的一组纯医学文本文档,任务的目标是识别并抽取出与医学临床相关的实体,并将他们归类到预先定义好的类别。将医学文本命名实体划分为九大类,包括:疾病(dis),临床表现(sym),药物(dru),医疗设备(equ),医疗程序(pro),身体(bod),医学检验项目(ite),微生物类(mic),科室(dep)。标注之前对文章进行自动分词处理,所有的医学实体均已正确切分。
2023-04-26 11:54:16 2376
原创 AutoML入门:AutoGluon
problem definition 和 data减少专家知识依赖缩短AI应用投产时间标准化建模流程,模块化发展业务适应业务发展按模型类型划分, AutoML可以被分为传统机器学习和针对深度学习的NAS(neural architecture search)。传统机器学习模型的自动化学习包含基础特征工程,算法选择以及机器学习pipeline等合成。针对深度学习的NAS,被视作一种自动设计神经网络的技术。通过NAS,根据样本集设计出高性能兼具准确率的网络结构。
2023-04-26 10:18:53 722
原创 MySql基础知识回顾
- 字段和多行函数不可以同时使用 SELECT num , AVG(sal) from emp -- x 多对1 SELECT num , AVG(sal) from emp GROUP BY deptno;
2023-03-14 21:01:22 311
原创 Huggingface教程微调一个模型在GPU中的实现
把datasets,transformer,huggingface_hub全部都升到最新版之后问题解决。这到底是啥问题,两边python的版本都是3.9.7。不知道,改了环境,路径,重写参数都不行,摆烂了。可是服务器已经一个通宵,有些离谱了家人们。接下来在定义超参数的时候又出现了问题。这是win10电脑导入的速度。参考github上的解答。
2023-02-21 10:51:45 738
原创 Questions with GPT-3
Transferring a pre-learned English model to a Chinese dataset can be done through a few different steps. First, it is important to ensure that the data has been pre-processed and formatted in a way that is suitable for the model. This may include tokenizin
2023-02-20 11:00:07 169
原创 LaTex初学
与常规软件类似,命令行程序也都是可执行程序,系统根据环境变量在PATH中存储的路径来搜索可供执行的程序,所以要保证LaTex和Tex相关的程序所在路径包含在PATH中。宏包(包括前面所说的文档类)可能定义了许多命令和环境,或者修改了 LATEX 已有的命令和环境。LaTex是一种使用Tex程序作为排版引擎的格式(format),可以理解为一层封装,最初的设计目标是分离内容和格式,以便作者能够专注于内容创作而非版式设计所谓的 TeX 发行版才是你要下载的「LaTeX」。调用的方法非常类似于调用文档类的方法。
2022-10-18 10:43:30 307
原创 外刊出版商
与仅开放获取的期刊相比,Frontiers期刊在6个类别(神经科学,心理学,多学科心理学,植物科学,药理学和药学和免疫学)中排名第一,并且在3个类别中排名第二(临床神经病学,内分泌学,和微生物学)。主要研究期刊包括BMC生物学,BMC医学,基因组生物学和基因组医学等选择性专题,血液学和肿瘤学期刊,疟疾杂志和微生物学等学术期刊,以及针对特定研究领域需求的65种包容性期刊。学术开放存取出版的先驱,202本期刊,促进所有学科的各种形式的开放式科学交流,MDPI自1996年,总部设在瑞士巴塞尔。
2022-10-11 22:02:40 1176
原创 【自存】学术英文论文实用句式和工具
The term ‘X’ was first used by …The term ‘X’ can be traced back to …Previous studies mostly defined X as …The term ‘X’ was introduced by Smith in her …Historically, the term ‘X’ has been used to describe …It is necessary here to clarify exactly what i
2022-09-23 16:50:20 210
原创 clinicalXLNET机械通气队列生成
Initial Cohort (Derived from ICUSTAYS)There are 46476 unique patients in this cohort.There are 57786 unique hospital admissions associated with this cohort.There are 61532 unique ICUSTAYs in this cohort.481 ICUSTAYs are missing CHARTEVENTS data.458 .
2022-04-21 10:43:52 248
原创 查看linux服务器的硬件信息
物理CPU个数:cat /proc/cpuinfo | grep "physical id" | sort | uniq | wc -l物理CPU内核个数:cat /proc/cpuinfo | grep "cpu cores" | uniq查看逻辑CPU的个数:cat /proc/cpuinfo | grep "processor" | wc -l每个物理CPU中逻辑CPU的个数:cat /proc/cpuinfo | grep 'siblings' | uniq.
2022-03-31 16:44:44 401
原创 MIMIC-III:MIMIC_Extract代码实例数据预处理
github原址:https://github.com/MLforHealth/MIMIC_Extract在做了前期的环境配置和相关函数生成文件之后,运行python mimic_direct_extract.py 会报错,主要的报错原因如下:我是在实验室服务器上运行的,这个连接psql数据库的时候默认端口是5432,也没有可以设置的地方,要自己根据原本函数的结构加一个自己的port上去。如果报找不到icustays关系之类的错,官方的代码反馈区有写,是因为sql的路径是mimiciii,但是
2022-03-23 20:13:00 2989 1
原创 MIMIC-III代码结构和运行
benchmark - 各种指数速度测试buildmimic - 在关系数据库管理系统 (RDMS) 中构建 MIMIC-III 的脚本,特别是postgres是我们选择的 RDMSconcepts - MIMIC-III 中数据的有用视图/摘要,例如人口统计、器官衰竭评分、疾病严重程度评分、治疗持续时间、更易于分
2022-03-23 17:01:32 2419 3
原创 Linux Ubuntu 终端名称的变化 @ 前后的意义
@前为用户名@后为主机名初始root变为psql用户psql用户转到psql命令行psql切换数据库psql命令行退出到psql用户再到root切换主机名再进入特定的conda环境
2022-03-04 09:22:24 755
原创 实验室Ubuntu系统GPU服务器安装Pytorch深度学习框架
连接服务器之后检查系统版本root@6f65f3f5d148 ~# getconf LONG_BIT2. 在设定的目录下下载anaconda安装包(使用清华镜像源)root@6f65f3f5d148 ~/u/pytorch# wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2021.11-Linux-x86_64.sh 开始安装3. 在安装的目录下执行bash Anaconda3-2021..
2022-03-01 10:12:54 373
原创 每次连接服务器postgre数据库都要执行的步骤
在终端启动服务器root@6f65f3f5d148 ~# pg_ctlcluster 13 main start查看数据库状态root@6f65f3f5d148 ~# service postgresql status切换到数据库用户root@6f65f3f5d148 ~# sudo su postgres打开数据库命令行 postgres@6f65f3f5d148:/root$ psql连接模式postgres=# \c mimic;mimic=# set .
2022-02-25 09:52:55 728
原创 Ubuntu安装Postgresql 搭建MIMIC-III debug 之路
安装Postgresql(已经是root不用sudo命令)# Update the package lists:apt-get updateapt-get upgradeapt-get -y install postgresql尝试查看版本切换用户报错原因:原链接尝试登录报错原因:原链接尝试创建一个用户重装试一试给root设置了一个密码切换用户的方法(1)从user用户切换到root用户sudo su(2)从root用户切回user.
2022-02-24 20:41:22 450
原创 宗成庆《文本数据挖掘》学习笔记:第二章 数据预处理和标注
系列文章目录提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例
2021-08-04 16:55:56 1284
原创 宗成庆《文本数据挖掘》学习笔记:第一章绪论
文章目录第一章:绪论1.数据挖掘二、使用步骤1.引入库2.读入数据总结第一章:绪论1.数据挖掘广义解释:数据挖掘是指从大量数据中挖掘有趣的模式和知识的过程。数据源:数据库,数据仓库、web、其他信息存储库或动态地流入系统的数据。文本数据挖掘:从自然语言文本中挖掘用户感兴趣的模式和知识的方法和技术,也称文本挖掘。文本:TXT文件,doc/docx,PDF文件和HTML文件等各类以语言为主要内容的数据文件。示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
2021-07-30 17:42:14 776
原创 python医学图像处理:Numpy、Matplotlib和直方图
文章目录前言一、Numpy1. 重要属性2. 创建方法二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、NumpyNumPy 的主要对象是齐次多维数组。它是一个元素表(通常是元素是数字),其中所有元素类型都相同,元素以正整数元组索引。在 NumPy 维度(dimension)被称为轴(axis
2021-04-23 20:17:51 2030 1
原创 Python医学图像处理:理论学习和nii图像预处理
学习目录医疗图像像素深度光度学解释nii文件nii.gz的载入功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入医学图像处理库PyMVPANilearnScikit-learnScikit-imagePyOpenCV(或CV2)PyO
2021-04-03 16:59:52 12803 1
空空如也
python导入glue数据库报错
2023-02-13
TA创建的收藏夹 TA关注的收藏夹
TA关注的人