![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
文本分类
程序猿进化之旅
JAVA 研发工程师
展开
-
scikit - learn 做文本分类
文章来源: https://my.oschina.net/u/175377/blog/84420 Scikit Learn: 在python中机器学习 Warning 警告:有些没能理解的句子,我以自己的理解意译。 翻译自:Scikit Learn:Machine Learning in Python 作者: Fabian Pedregosa, Gael Varoqu转载 2016-12-08 15:59:25 · 1403 阅读 · 0 评论 -
scikit -learn 的使用
由于做毕业论文方向是文本分类,需要用到scikit -learn 工具,借鉴前辈的基础上做了如下实验: 参考了scikit-learn的官方网站 1. 数据准备 关于分类,我们使用了Iris数据集,这个scikit-learn自带了. Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包原创 2016-12-08 16:04:44 · 388 阅读 · 0 评论 -
FastText的词向量表征
来源:http://blog.csdn.net/sinat_26917383/article/details/54850933 二、FastText的词向量表征 1、FastText的N-gram特征 常用的特征是词袋模型。但词袋模型不能考虑词之间的顺序,因此 fastText 还加入了 N-gram 特征。 “我 爱 她” 这句话中的词袋模型特征是 “我”,转载 2017-06-17 16:49:14 · 6685 阅读 · 2 评论 -
vmwear 上运行ubantu发行版
软件源: 1、Vmwear workstation 10 2、Ubantu 12.4、win 7 安装过程: 1、先执行Vmwear 10 安装文件 2、然后在Vmwear 中选择新建虚拟机(可以创建多个) 3、创建虚拟机账户名和密码 4、登录虚拟机 常用命令:su 切换账户, cd 进入文件目录,apt-get 包管理命令原创 2017-06-02 18:55:57 · 323 阅读 · 0 评论