- 博客(5)
- 收藏
- 关注
原创 医学病例命名实体识别案例
引言:NLP技术目前在社会各个领域都在应用,其中在命名实体识别方面应用很广泛,也是极具特色的。 一、利用NLP技术训练模型,来识别病例里面的关键信息。 1、搜集数据(训练数据、验证数据、测试数据还有一个字典(key:命名实体,value:实体类型)): 训练数据、验证数据、测试数据都是些病例文本信息,字典是我们要识别出来的命名实体,该字典会添加到,jieba分词工具里面,这样才能分出我们要的命名实体。 2、清洗、提取训练数据的特征 这个过程比较繁琐,这里就简单叙述一下: 1、创建一个词典 该词典是个dict
2020-08-16 00:17:46
2686
1
原创 CNN——对文章类型进行分类
引言:最进在搞机器学习,写了几篇东西,这准备用NLP技术,写一个对文章类型分类的模型。 一、搜集训练数据、验证数据和测试数据: 上面图中,分别是 : essay.test(测试数据): essay.train(训练数据): essay.val(验证数据): essay.vocab(词表): 二、训练数据特征提取: 1、定义文件路径 # 主目录 root_path = 'data/essayData/data' # 训练数据路径 train_path = os.path.join(root_path
2020-08-11 18:06:29
1398
原创 泰坦尼克号——“十年生死两茫茫”
机器学习——泰坦尼克号生死预测案例 引言:学习机器学习已经有一段时间了,在Kaggle里看到一个针对初学者练手的一个案例——关于泰坦尼克号之灾,今天我也拿它来练练手,顺便记录一下。 一、先从Kaggle官网上下载一些数据: 下载完,我们得到压缩包,挤压后得到3个文件,一个是训练数据集 train.csv,一个是测试数据集test.csv,还有一个是记录乘客Id和是否存活的文件gender_submission.csv。 这样,我们项目数据已经准备好了。 二、特征提取(对数据分析和清洗) 重要提示:我之前是
2020-08-10 01:39:25
492
原创 机器学习——逻辑回归
机器学习——逻辑回归 一、逻辑回归 logistic回归又称logistic回归分析,常用于数据挖掘,疾病自动诊断,经济预测等领域。它是一种广义的线性回归分析模型,因此与多重线性回归分析有很多相同之处。它们的模型形式基本上相同,都具有 w‘x+b,其中w和b是待求参数,其区别在于他们的因变量不同,多重线性回归直接将w‘x+b作为因变量,即y =w‘x+b,而logistic回归则通过函数L将w‘x+b对应一个隐状态p,p =L(w‘x+b),然后根据p 与1-p的大小决定因变量的值。如果L是logistic
2020-08-08 22:12:04
720
原创 机器学习启蒙
机器学习——线性回归 引言:”线性回归“这个是我接触的第一个机器学习,对于刚刚学习 机器学习的同学,这个是一个很好的入手点,下面我针对“线性回归”进行详细的介绍。 一、什么是线性回归,“线性回归”可以分成“线性”、“回归 ”: 例如方程:y=a*x+b , 线性:它是一次方的线性变化 回归:回归到平均值(基于正态分布) 总而言之:“线性回归” 就是利用线性模型结合回归性质,来拟合我们需要的数据,注意:做机器学习,没有完美解。因此我们最后得到的解不是一个完美解。 二、求解线性回归的模型和参数的定义: 例如:
2020-08-08 16:00:09
344
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人