自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 医学病例命名实体识别案例

引言:NLP技术目前在社会各个领域都在应用,其中在命名实体识别方面应用很广泛,也是极具特色的。一、利用NLP技术训练模型,来识别病例里面的关键信息。1、搜集数据(训练数据、验证数据、测试数据还有一个字典(key:命名实体,value:实体类型)):训练数据、验证数据、测试数据都是些病例文本信息,字典是我们要识别出来的命名实体,该字典会添加到,jieba分词工具里面,这样才能分出我们要的命名实体。2、清洗、提取训练数据的特征这个过程比较繁琐,这里就简单叙述一下:1、创建一个词典该词典是个dict

2020-08-16 00:17:46 2686 1

原创 CNN——对文章类型进行分类

引言:最进在搞机器学习,写了几篇东西,这准备用NLP技术,写一个对文章类型分类的模型。一、搜集训练数据、验证数据和测试数据:上面图中,分别是 :essay.test(测试数据):essay.train(训练数据):essay.val(验证数据):essay.vocab(词表):二、训练数据特征提取:1、定义文件路径# 主目录root_path = 'data/essayData/data'# 训练数据路径train_path = os.path.join(root_path

2020-08-11 18:06:29 1401

原创 泰坦尼克号——“十年生死两茫茫”

机器学习——泰坦尼克号生死预测案例引言:学习机器学习已经有一段时间了,在Kaggle里看到一个针对初学者练手的一个案例——关于泰坦尼克号之灾,今天我也拿它来练练手,顺便记录一下。一、先从Kaggle官网上下载一些数据:下载完,我们得到压缩包,挤压后得到3个文件,一个是训练数据集 train.csv,一个是测试数据集test.csv,还有一个是记录乘客Id和是否存活的文件gender_submission.csv。这样,我们项目数据已经准备好了。二、特征提取(对数据分析和清洗)重要提示:我之前是

2020-08-10 01:39:25 492

原创 机器学习——逻辑回归

机器学习——逻辑回归一、逻辑回归logistic回归又称logistic回归分析,常用于数据挖掘,疾病自动诊断,经济预测等领域。它是一种广义的线性回归分析模型,因此与多重线性回归分析有很多相同之处。它们的模型形式基本上相同,都具有 w‘x+b,其中w和b是待求参数,其区别在于他们的因变量不同,多重线性回归直接将w‘x+b作为因变量,即y =w‘x+b,而logistic回归则通过函数L将w‘x+b对应一个隐状态p,p =L(w‘x+b),然后根据p 与1-p的大小决定因变量的值。如果L是logistic

2020-08-08 22:12:04 721

原创 机器学习启蒙

机器学习——线性回归引言:”线性回归“这个是我接触的第一个机器学习,对于刚刚学习 机器学习的同学,这个是一个很好的入手点,下面我针对“线性回归”进行详细的介绍。一、什么是线性回归,“线性回归”可以分成“线性”、“回归 ”:例如方程:y=a*x+b ,线性:它是一次方的线性变化回归:回归到平均值(基于正态分布)总而言之:“线性回归” 就是利用线性模型结合回归性质,来拟合我们需要的数据,注意:做机器学习,没有完美解。因此我们最后得到的解不是一个完美解。二、求解线性回归的模型和参数的定义:例如:

2020-08-08 16:00:09 344

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除