![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
常见小问题
LBJ5588
这个作者很懒,什么都没留下…
展开
-
【无标题】
NLTK:自然语言处理工具包,是聊天机器人需要的比较重要的一个工具安装:pip install nltk[root@centos #] pythonPython 2.7.11 (default, Jan 22 2016, 08:29:18)[GCC 4.2.1 Compatible Apple LLVM 7.0.2 (clang-700.1.81)] on darwinType "help", "copyright", "credits" or "license" for more informa原创 2022-01-13 10:55:26 · 165 阅读 · 0 评论 -
【无标题】
基于TF-IDF的文本相似度计算相似度就是去量化的比较两个事物的一种度量,实质计算机能够识别的就是二进制符号,所以对于相似度的计算可以是文本、音频、图片等方面。首先,介绍一种最为简单的相似度计算方法:余弦相似度余弦相似度的思想就是把两个向量的夹角进行余弦值计算,取值范围应该在0和1之间...原创 2022-01-11 17:21:36 · 171 阅读 · 0 评论 -
【无标题】
小坑小细节导入joblib包的时候:这是第一种方法; import joblib还有第二种方法; from sklearn.externals import joblib需要从sklearn里面导入,如果方式不对有可能代码会报错在这里插入代码片原创 2021-12-22 09:58:00 · 49 阅读 · 0 评论 -
【无标题】
python 入门当你看到输出语句存在%d,%s,%f等百分号的时候,就接触到python 字符串格式化输出相关知识。Python 支持字符串格式化输出,尽管这样可能遇到非常复杂的表达式,但最基本的是用法就是将一个值插入到一个有字符串格式符%s的字符串中。如,例1:name = '阿昌'print("大家好,我叫%s"%name)输出大家好,我叫阿昌在程序中,看到%s这样的操作符,这就是python中字符串格式化的符号。除此之外,还可以用%符号对其他类型的数据进行格式化。常见的格式化符号如下转载 2021-12-03 15:25:26 · 60 阅读 · 0 评论 -
python2和python差异的
python2和python差异的通常我们为了防止出现乱码会进行一下操作import sysreload(sys)sys.setdefaultencoding(‘utf-8’)但这是python2的写法,但是在python3中这个需要已经不存在了,这么做也不会什么实际意义。如果你要这么做就会出现一下错误sys.setdefaultencoding(‘utf-8’)AttributeError: module ‘sys’ has no attribute ‘setdefaultencoding原创 2021-11-24 09:45:11 · 599 阅读 · 0 评论 -
正则定义(bulabula)
正则定义(bulabula)我们管[公式]叫做经验风险,管上面我们思维导图的过程叫做正则化,所以顺其自然的管r(d)叫做正则化项,然后管[公式]+r(d) 叫做结构风险,所以顺其自然的正则化就是我们将结构风险最小化的过程,它们是等价的...原创 2021-09-17 16:52:45 · 295 阅读 · 0 评论 -
2021-09-16
多分类的利弊单标签多分类:1.(利)可以预测一个准确的客户意愿,特征数据协调起来比较简单,即分配不同的权重,特殊情况拿出来处理一下2.(弊)不能得出一个全面的意愿结果,客户有时候确实是有汽车相关的意愿还有出行的意愿,多标签多分类:1.(利)全面预测客户意愿2.(弊):做起来比较复杂,需考虑预测值之间的依赖等问题困难:具体到分类采用 OVO(一对一) OVR(一对多)还是纠错码机制(多对多)多标签的的输入数据标签之间的依赖关系处理模型的泛化能力能达到怎么样的一个程度做多分类:可以用打分原创 2021-09-16 17:41:39 · 39 阅读 · 0 评论