自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (1)
  • 收藏
  • 关注

原创 NLP之三特征提取

1、基本文本处理技能(1)、分词的概念分词的正向最大分词的逆向最大分词的双向最大匹配法(2)、词、字符频率统计可使用python的collections.Counter模块,也可以用自己找到的其他更好用的库2、语言模型(1)、unigram、bigram、trigram概念(2)、unigram、bigram频率统计3、文本矩阵化要求采用词袋模型且是词级别的矩阵化分词(...

2019-03-03 23:09:10 659

原创 自然语言处理之二NLP之数据集探索

NLP之数据集探索1、IMDB数据集下载和探索2、THUCNews数据集下载和探索数据集链接: https://pan.baidu.com/s/15p_W4EPXEVSZ7GxQ_lkISg提取码:0mmy参考链接:1、CNN字符级中文文本分类-基于TensorFlow实现2、text-classification-cnn-rnn(1)、数据集介绍数据集的详细介绍参见这篇说明:h...

2019-03-03 18:06:49 443

原创 自然语言处理之一NLP基础

自然语言处理基础1、学习说明学习自然语言处理理论,并且通过对某些数据集的文本分类任务不断优化来进行实践。任务路线: 特征提取——>特征选择——>文本表示——>传统机器学习算法跑模型——>LDA生成新特征——>深度学习算法跑模型2、tensorflow的安装和基础图(graphs)、会话(session)、tensor、变量、feed、f

2019-03-03 14:42:53 196

原创 机器学习之二用sk-learn实现波士顿房价预测(单变量)

1、使用sk-learn进行波士顿房价预测的过程(1)、波士顿地区房价数据获取,数据来自于sklearn自带数据集;(2)、波士顿地区房价数据分割;(3)、训练与测试数据标准化处理;(4)、使用最简单的线性回归模型LinearRegression对房价进行预测。2、回归性能评价MSE(Mean Squared Error):均方误差。 是真实值与预测值的差值的平方然后求和平均。常被用作...

2019-03-03 13:39:35 5017

原创 解决弃用警告:This module was deprecated in version 0.18 in favor of the model_selection modul into which a

弃用警告消除在pycharm中导入sklearn.cross_validation模块时,发现以下warning而不是error,说明程序虽然可以正常使用但是有警告出现:from sklearn.cross_validation import train_test_splitC:\Users\Admin\Anaconda3\lib\site-packages\sklearn\cross_v...

2019-03-03 10:47:44 1528

mnist数据集、tensoflow实现手写图片识别代码

本资源是自己初学机器学习时,成功调试出来的mnist手写数字识别代码过程,资源包括官方mnist数据集,自己手写的图片资源,用tensorflow框架搭建CNN,包括数据训练和测试过程。

2018-10-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除