2021-03-20

最新推荐文章于 2024-01-09 01:22:20 发布

居贝比

最新推荐文章于 2024-01-09 01:22:20 发布

阅读量122

点赞数

分类专栏： python 文章标签：非负矩阵分解 NMF 文本挖掘主题建模 TF-IDF

本文链接：https://blog.csdn.net/xyy731121463/article/details/115036366

版权

python 专栏收录该内容

17 篇文章 3 订阅

订阅专栏

NMF
非负矩阵分解（NMF）是一种无监督的技术，因此没有标签可供训练的主题。它的工作方式是NMF将高维向量分解（或分解）为低维表示。这些低维向量是非负的，这也意味着它们的系数是非负的。

使用原始矩阵（A），NMF将为您提供两个矩阵（W和H）。W是找到的主题，H是这些主题的系数（权重）。换句话说，A是按词的文章（原始），H是按主题的文章，而W是按词的主题。

因此，假设有301篇文章，5000个单词和30个主题，我们将获得以下3个

A = tfidf_vectorizer.transform（texts）
W = nmf.components_
H = nmf.transform（A）

A = 301 x 5000
W = 30 x 5000
H = 301 x 30

NMF将修改W和H的初始值，以使乘积接近A，直到逼近误差收敛或达到最大迭代次数为止。
在我们的案例中，高维向量将是tf-idf权重，但实际上可以是任何东西，包括单词向量或单词的简单原始计数。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

居贝比

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

向量的分解

LB_yifeng的博客

10-23

2653

【题目】如图，在 △ABC\triangle ABC△ABC 中，设 AB→=a→\overrightarrow{AB}=\overrightarrow{a}AB=a ，AC→=b→\overrightarrow{AC}=\overrightarrow{b}AC=b，APAPAP 的中点为 QQQ，BQBQBQ 的中点为 RRR，CRCRCR 的中点恰为 PPP，则 AP→=()\overrig...

2021-03-17

m0_56206427的博客

03-17

1402

如何在阿里云服务器部署项目，用到阿里的负载均衡服务，查了一些资料。由此记录一下，方便以后再次使用：第一步：创建负载均衡实例官方教程链接：创建负载均衡实例点击创建负载均衡实例，选择负载均衡规格，输入实例名称(给负载均衡起个小名)，点击去购买，对勾购买协议，点击去开通。![这两天准备在阿里云服务器部署项目，用到阿里的负载均衡服务，查了一些资料。由此记录一下，方便以后再次使用：第一步：创建负载均衡实例官方教程链接：创建负载均衡实例点击创建负载均衡实例，选择负载均衡规格，输入实例名称（给负载均衡起个小名儿）

参与评论您还未登录，请先登录后发表或查看评论

高维向量空间的特征选择方法

最新发布

AI天才研究院

01-09

909

1.背景介绍高维向量空间的特征选择方法是一种常用的机器学习和数据挖掘技术，它主要用于处理高维数据的特征选择和降维问题。在现代数据挖掘中，数据集通常包含大量的特征，这些特征可能会导致计算复杂性和模型性能的下降。因此，特征选择成为了一项重要的技术，它可以帮助我们选择出与目标变量相关的特征，从而提高模型的准确性和效率。在高维向量空间中，特征选择方法可以分为两类：一是基于距离的方法，如PCA(主成...

向量学习之高维思考

李赛男

11-15

804

前两年看了一部电影叫《星际穿越》，电影的最后有个精彩的桥段，是男主跌落到了宇宙中的黑洞深处。他发现自己进入了一个高维空间。他能够看到他在地球上的女儿，他女儿看不见他。而且能看到不同时空状态下他的女儿。比如昨天的，现在的和明天的女儿。当时就觉得编剧脑洞真大，可最近两年大家总在说高维思考，理论不好理解，但是这部电影其实很好的诠释了高维的概念，三维大家都知道，第四维其实就是时间，看似完全没有联系的内容就通过一个新的概念联系在了一起，就好像最近我们在学习的向量，里面有很多的数学概念，因为断断续续的学习，其实有些内容

Tensorboard高维向量可视化

泛用演化计算、通用人工智能优化模型。

07-18

7499

Tensorflow高维向量可视化觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文献强烈推荐Tensorflow实战Google深度学习框架实验平台: Tensorflow1.4.0 python3.5.0 MNIST数据集将四个文件下载后放到当前目录下的MNIST_data文件夹下高维向量表示为了更加直观的了解emb...

2021-01-06

qq_40504996的博客

01-06

931

运行机某个js文件访问不了。做了过滤器，没有被过滤的。其他js文件都可以。就单独一个403。考虑是否是防火墙做了一些敏感词的判断过滤。将js文件名修改试一下，或者从防火墙那方面做文章 ...

2021-06-03

imxiaoxin的博客

08-13

6686

七夕表白福利现在送达！妈妈再也不用担心你找不到女朋友了！明天就是七夕了！如果有对象，祝早生贵子！没有对象，祝早结连理！（搞笑一下，祝大家幸福美满吧，嘿嘿嘿）今天小编给大家分享一些用代码制作的表白，或者也可以说是七夕礼物！有需要的看最后哦！ python满屏弹窗代码： import tkinter as tk import random import threading import time #更多表白源码需要加群：425728613# def biaobai(): window =

2021-03-22

热门推荐

weixin_49755150的博客

03-22

2万+

CheckM8 发布了全新3.0版本。全新版本有了全新的功能：支持MEID 激活锁解信号支持三网（移动、联通、电信）国行版手机解锁打电话4G等支持打电话、短信、4G上网、重启、通知、iCloud登录支持解锁SIM卡运营商锁支持checkra1n越狱的所有版本苹果55s66P6S6SP77P88PX等等支持iOS 14 苹果手机激活锁停用Hello密码锁苹果手机忘记密码绕ID屏幕锁密码越狱解锁ID已停用支持iOS14 苹果手机绕激活绕ID可打电话4G ...

2021-01-10

qq_22667507的博客

01-10

1024

jupyter notebook中直接安装python的第三方库。例如安装pymysql ： ! pip install pymysql。升级pip：

2021-03-07

scqq1的专栏

03-07

1387

centos 8 pip install aiohttp multidict/_multidict.c:1:10: 致命错误：Python.h：没有那个文件或目录 #include "Python.h" ^~~~~~~~~~ 编译中断。 error: command 'gcc' failed with exit status 1 ---------------------------------------- Command ...

2021-03-20-vintepila-Gabriel

03-22

标题 "2021-03-20-vintepila-Gabriel" 暗示这可能是一个软件项目或代码库的版本标识，日期表示该版本是在2021年3月20日创建或更新的。"Gabriel"可能是开发者的姓名，或者是项目的特定分支或主题。标签 "C" 指出这个...

react-clock-2021-03-20

03-21

根据压缩包文件名“react-clock-2021-03-20-master”，我们可以推测项目可能采用Git进行版本控制，并且“master”分支代表了项目的主线或稳定状态。Git是一种分布式版本控制系统，用于跟踪对文件和目录的修改，这...

c 输出整数2021-03-20.png

03-20

c 输出整数

2021-03-05_20-14-58_Underwater Survival Base.zip

03-07

2021年3月5日20时14分58秒，这个项目被封装在名为"2021-03-05_20-14-58_Underwater Survival Base.zip"的压缩文件中，它可能包含了设计图纸、研究报告、技术文档等一系列珍贵资料，为我们的讨论提供了宝贵的素材。...

tampermonkey-backup-chrome-2021-11-27T01-27-17-766Z.zip

11-27

配置过的油猴插件

解决报错“No module named ‘pyLDAvis.gensim‘”

居贝比的博客

04-23

1万+

在python编码中，别人的代码可以正常导入而我的不行 import pyLDAvis.gensim 一运行就报错“No module named ‘pyLDAvis.gensim’” 网上查了很多都没有针对性的，直到上了Google 找到了个大佬写的说pyLDAvis是最新的3.3.x版本，而之前是3.2.2版本，所以会出现报错 3.3.0之后的版本必须重命名文件夹所以要使用： import pyLDAvis.gensim_models 后面的也用这个代替即可！！困扰了我一个多小时看来国外的大

python flask将读取的图片返回给web前端

居贝比的博客

07-04

1万+

网上找到的python代码（核心部分）： def return_img_stream(img_local_path): """ 工具函数: 获取本地图片流 :param img_local_path:文件单张图片的本地绝对路径 :return: 图片流 """ import base64 img_stream = '' with open(img_local_path, 'r') as img_f: img_stream

python找到最大最小值、最大最小值的位置、删除最大值最小值

居贝比的博客

07-06

1万+

a = [12,11,2,55,7,1,4123] b = np.array([[1,6,9,], [9,0,1123]]) print(a.index(min(a))) # 返回第一个最小值的位置 print(a.index(max(a))) # 返回第一个最大值的位置 print(np.max(b)) # 返回最大值 print(np.min(b)) # 返回最小值 print(np.argmax(b)) # 返回第一个最小值的位置 print(np.argmin(b)) # 返回第一个最大

解决pytorch报错：Torch not compiled with CUDA enabled

居贝比的博客

11-22

5859

在进行AI深度学习的时候，必不可少需要用到CUDA，但是能正常配置好环境是最难的部分 import torch print(torch.__version__) print(torch.cuda.is_available()) 在执行后，如果显示false，则代表并没有正确运行需要找到自己CUDA的版本(自行百度检测方法) 重点是如何下载安装对应的版本很多博客上都是使用类似于自己找对应的版本手动下载如下图：但是直接在官网选择和自己电脑对应的版本可以一键复制下载命令自动下载安装官网传送→ 如下

2021-03-26 20:54:33,596 - Model - INFO - Epoch 1 (1/200): 2021-03-26 20:57:40,380 - Model - INFO - Train Instance Accuracy: 0.571037 2021-03-26 20:58:16,623 - Model - INFO - Test Instance Accuracy: 0.718528, Class Accuracy: 0.627357 2021-03-26 20:58:16,623 - Model - INFO - Best Instance Accuracy: 0.718528, Class Accuracy: 0.627357 2021-03-26 20:58:16,623 - Model - INFO - Save model... 2021-03-26 20:58:16,623 - Model - INFO - Saving at log/classification/pointnet2_msg_normals/checkpoints/best_model.pth 2021-03-26 20:58:16,698 - Model - INFO - Epoch 2 (2/200): 2021-03-26 21:01:26,685 - Model - INFO - Train Instance Accuracy: 0.727947 2021-03-26 21:02:03,642 - Model - INFO - Test Instance Accuracy: 0.790858, Class Accuracy: 0.702316 2021-03-26 21:02:03,642 - Model - INFO - Best Instance Accuracy: 0.790858, Class Accuracy: 0.702316 2021-03-26 21:02:03,642 - Model - INFO - Save model... 2021-03-26 21:02:03,643 - Model - INFO - Saving at log/classification/pointnet2_msg_normals/checkpoints/best_model.pth 2021-03-26 21:02:03,746 - Model - INFO - Epoch 3 (3/200): 2021-03-26 21:05:15,349 - Model - INFO - Train Instance Accuracy: 0.781606 2021-03-26 21:05:51,538 - Model - INFO - Test Instance Accuracy: 0.803641, Class Accuracy: 0.738575 2021-03-26 21:05:51,538 - Model - INFO - Best Instance Accuracy: 0.803641, Class Accuracy: 0.738575 2021-03-26 21:05:51,539 - Model - INFO - Save model... 2021-03-26 21:05:51,539 - Model - INFO - Saving at log/classification/pointnet2_msg_normals/checkpoints/best_model.pth 我有类似于这样的一段txt文件，请你帮我写一段代码来可视化这些训练结果

02-06

你好，根据你提供的信息，我可以帮助你写一个 Python 代码来可视化训练结果。首先，你需要读入这个 txt 文件，并将其转换为 Python 可以处理的数据结构，例如列表或字典。接下来，你可以使用 Python 的可视化库，...