![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 57
JaxHur
这个作者很懒,什么都没留下…
展开
-
【机器学习】TF-IDF以及TfidfVectorizer
TfidfVectorizer使用的计算TF-IDF的公式与定义有差别。但实际上表达的意思是相同的,都是在该文档中的重要性TF乘以在语料库中的重要性IDF的乘积。np.log()其实是以e为底的,所以如果要计算以其他数为底的对数,需要进行换底公式LogablogcblogcaLogablogcalogcbdef Log(newd,number): #newd新底Log(10,10)原创 2023-09-17 22:24:23 · 983 阅读 · 0 评论 -
【机器学习】文本多分类
训练集train.csv中有120000条数据,测试集test.csv中有7600条数据。两个文件中记录的是新闻,均只有3列,第1列记录了新闻的种类(world,sports,sci/Tech,Business,记录与class.txt中),总共有4类[3,4,2,1],且每一类的占比均为25%;第2列记录了新闻标题,第3列记录了新闻的大致内容。原创 2023-09-16 22:11:40 · 1236 阅读 · 0 评论 -
【聚类】K-Means聚类
因此计算量大。原创 2023-09-03 21:08:47 · 880 阅读 · 0 评论 -
【聚类】DBCAN聚类
OPTICS是基于DBSCAN改进的一种密度聚类算法,对参数不敏感。当需要用到基于密度的聚类算法时,可以作为DBSCAN的一种替代的优化方案,以实现更优的效果。原创 2023-09-04 12:56:11 · 1632 阅读 · 0 评论 -
【python】求出数组的累和和累积
【代码】【python】求出数组的累和和累积。原创 2023-09-03 11:17:26 · 256 阅读 · 0 评论 -
【python】np.multiply()函数、np.multiply()函数、星号(*)
数组和矩阵,输出与相乘数组/矩阵的大小一致。原创 2023-09-03 10:40:53 · 953 阅读 · 0 评论 -
python 微分函数
s = sp.dsolve(eq, ics={x(0):x1[0], x(5):x1[-1]}) #求微分方程符号解。sp.var('x', cls=sp.Function) #定义符号变量和函数。sp.lambdify(t, xt, 'numpy') #转换为匿名函数。xt = s.args[1] #提取解的符号表达式。原创 2023-08-22 21:17:52 · 119 阅读 · 0 评论 -
python中KFold函数是怎么划分数据的
准备了30条测试数据。原创 2023-08-21 18:41:01 · 822 阅读 · 0 评论 -
python求出矩阵的特征值与特征向量
【代码】python求出矩阵的特征值与特征向量。原创 2023-09-02 14:21:35 · 980 阅读 · 0 评论 -
python借助isinstance(item, (int, float))提取列表中的数字
如下一个列表[1,2,3,'23',' ',123]原创 2023-09-02 16:50:40 · 220 阅读 · 0 评论 -
apply对dataframe的一个小应用
【代码】apply对dataframe的一个小应用。原创 2023-09-02 15:31:38 · 34 阅读 · 0 评论 -
python实现zscore归一化和minmax标准化
【代码】python实现zscore归一化和minmax标准化。原创 2023-09-02 14:49:16 · 1002 阅读 · 0 评论 -
jpg图片转成列表为什么是三维数组
最近要做一个使用PCA对人脸图像进行降维,并使用距离的大小,进行人脸识别的一个作业。原创 2023-03-30 19:57:57 · 538 阅读 · 0 评论 -
python中np.random的使用
【代码】python中np.random的使用。原创 2023-09-03 09:01:43 · 397 阅读 · 0 评论 -
【分类】分类性能评价
属于各类的样本的并不是均一分布,甚至其出现概率相差很多个数量级,这种分类问题称为不平衡类问题。在不平衡类问题中,准确率并没有多大意义,我们需要一些别的指标。 通常在不平衡类问题中,我们使用F-度量来作为评价模型的指标。以为例,预测只可能出现4种状况: a) 将正类样本预测为正类(True Positive, TP) b) 将负类样本预测为正类(False Positive, FP)原创 2023-09-02 21:59:26 · 1122 阅读 · 0 评论 -
神经网络--感知机
即求“支付金额关于苹果的价格的导数”。这意味着,如果苹果的价格上涨1元,最终的支付金额会增加2.2元(严格地讲,如果苹果的价格增加某个微小值,则最终的支付金额将增加那个微小值的2.2倍)构成一条直线,这也是单层感知机的局限,可以实现与门、与非门(与门取反)、或门三种逻辑电路,无法实现异或门(XOR,(与非门和或门)的与 )逻辑电路.反向传播时,会将上游的值乘以−y2(正向传播的输出的平方乘以−1后的值)后,再传给下游。计算图中,上游的值乘以正向传播时的输出(例中是exp(−x))后,再传给下游。原创 2023-09-02 09:02:45 · 935 阅读 · 0 评论 -
贝叶斯网络
尽管有这样过于简单的假设,但朴素贝叶斯分类模型能指数级降低贝叶斯网络构建的复杂性,同时还能较好地处理训练样本的噪声和无关属性。 简单来说,朴素贝叶斯分类就是:通过某对象的先验概率利用贝叶斯公式计算其后验概率,即该对象属于某一类概率,选择后验概率最大的。,从而避免了等于零的情况出现,并且在训练集较大时,修正对先验的影响也会降低到可以忽略不计。的时候,该概率与其他概率相乘的时候会把其它概率覆盖,因此需要引入。是一种简单的构造分类器的方法。的概率分布,如正态分布,然后用训练样本估计其中的参数。原创 2023-09-02 08:39:45 · 490 阅读 · 0 评论