![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 59
躺平yyds
这个作者很懒,什么都没留下…
展开
-
one-hot编码
one-hot编码,又称独热编码、一位有效编码。one hot在特征提取上属于词袋模型(bag of words)优缺点分析优点:- 一是解决了分类器不好处理离散数据的问题- 二是在一定程度上也起到了扩充特征的作用(上面样本特征数从3扩展到了9)缺点:- 它是一个词袋模型,不考虑词与词之间的顺序- 它假设词与词相互独立(在大多数情况下,词与词是相互影响的)- 它得到的特征是离散稀疏的原创 2022-08-21 15:45:56 · 25810 阅读 · 3 评论 -
前向,逆向,双向最大匹配算法原理及实现
正向最大匹配算法的基本思想为:假定分词词典中的最长词有个汉字字符,则用被处理文档的当前字串中的前个字作为匹配字段,查找字典。若字典中存在这样的一个字词,则匹配成功,匹配字段被作为一个词切分出来。如果词典中找不到这样的一个1字词,则匹配失败,将匹配字段中的最后一个字去掉,对剩下的字串重新进行匹配处理。如此进行下去,直到匹配成功,即切分出一个词或剩余字串的长度为零为止。这样就完成了一轮匹配,然后取下一个i字逆向最大匹配的基本原理与正向最大匹配法相同,不同的是分词切分的方字串进行匹配处理,直到文档被扫描完为止。原创 2022-08-16 16:30:57 · 2510 阅读 · 1 评论 -
如何配置conda环境及conda常用命令
代码来自清华镜像源,保存退出即可即可添加 Anaconda Python 免费仓库。的仓库地址在国外,当你下载工具包时,下载速度会很慢,所以改到国内来。在anaconda命令行界面下执行命令代码。生成修改文件,执行命令后再主目录下会生成。文件,删除文件内的全部内容,添加下列代码。清楚索引缓存,保证用的是镜像站提供的索引。Windows 用户无法直接创建名为。环境及conda常用命令。生成该文件之后再修改。创建虚拟环境和下载包测试。conda 常用命令。.........原创 2022-08-06 10:47:09 · 2564 阅读 · 0 评论