自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 医学病例命名实体识别案例

引言:NLP技术目前在社会各个领域都在应用,其中在命名实体识别方面应用很广泛,也是极具特色的。 一、利用NLP技术训练模型,来识别病例里面的关键信息。 1、搜集数据(训练数据、验证数据、测试数据还有一个字典(key:命名实体,value:实体类型)): 训练数据、验证数据、测试数据都是些病例文本信息,字典是我们要识别出来的命名实体,该字典会添加到,jieba分词工具里面,这样才能分出我们要的命名实体。 2、清洗、提取训练数据的特征 这个过程比较繁琐,这里就简单叙述一下: 1、创建一个词典 该词典是个dict

2020-08-16 00:17:46 2686 1

原创 CNN——对文章类型进行分类

引言:最进在搞机器学习,写了几篇东西,这准备用NLP技术,写一个对文章类型分类的模型。 一、搜集训练数据、验证数据和测试数据: 上面图中,分别是 : essay.test(测试数据): essay.train(训练数据): essay.val(验证数据): essay.vocab(词表): 二、训练数据特征提取: 1、定义文件路径 # 主目录 root_path = 'data/essayData/data' # 训练数据路径 train_path = os.path.join(root_path

2020-08-11 18:06:29 1398

原创 泰坦尼克号——“十年生死两茫茫”

机器学习——泰坦尼克号生死预测案例 引言:学习机器学习已经有一段时间了,在Kaggle里看到一个针对初学者练手的一个案例——关于泰坦尼克号之灾,今天我也拿它来练练手,顺便记录一下。 一、先从Kaggle官网上下载一些数据: 下载完,我们得到压缩包,挤压后得到3个文件,一个是训练数据集 train.csv,一个是测试数据集test.csv,还有一个是记录乘客Id和是否存活的文件gender_submission.csv。 这样,我们项目数据已经准备好了。 二、特征提取(对数据分析和清洗) 重要提示:我之前是

2020-08-10 01:39:25 492

原创 机器学习——逻辑回归

机器学习——逻辑回归 一、逻辑回归 logistic回归又称logistic回归分析,常用于数据挖掘,疾病自动诊断,经济预测等领域。它是一种广义的线性回归分析模型,因此与多重线性回归分析有很多相同之处。它们的模型形式基本上相同,都具有 w‘x+b,其中w和b是待求参数,其区别在于他们的因变量不同,多重线性回归直接将w‘x+b作为因变量,即y =w‘x+b,而logistic回归则通过函数L将w‘x+b对应一个隐状态p,p =L(w‘x+b),然后根据p 与1-p的大小决定因变量的值。如果L是logistic

2020-08-08 22:12:04 720

原创 机器学习启蒙

机器学习——线性回归 引言:”线性回归“这个是我接触的第一个机器学习,对于刚刚学习 机器学习的同学,这个是一个很好的入手点,下面我针对“线性回归”进行详细的介绍。 一、什么是线性回归,“线性回归”可以分成“线性”、“回归 ”: 例如方程:y=a*x+b , 线性:它是一次方的线性变化 回归:回归到平均值(基于正态分布) 总而言之:“线性回归” 就是利用线性模型结合回归性质,来拟合我们需要的数据,注意:做机器学习,没有完美解。因此我们最后得到的解不是一个完美解。 二、求解线性回归的模型和参数的定义: 例如:

2020-08-08 16:00:09 344

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除