[R语言]文本分类(2)

最新推荐文章于 2023-07-22 14:13:45 发布

txHe

最新推荐文章于 2023-07-22 14:13:45 发布

阅读量2.5k

点赞数

分类专栏： R语言 NLP-自然语言处理文章标签： r语言

本文链接：https://blog.csdn.net/htx931005/article/details/49494195

版权

本文档介绍了使用R语言进行文本分类的过程，特别是如何制作语料库。内容包括将标题和描述合并作为特征，进行分词、去除停用词，最终生成文档-词项矩阵，为监督学习的分类任务准备数据。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

上一节，介绍了R语言，和本人做文本分类时运用的几个包，还有个小例子。
这一节就用代码来简单介绍下我做文本分类的过程。

我的分类很简单，就是给你一段文字，你将它分类到特定的类别。当然，这是前提是需要大量的语料库，且已经分好类。可以理解为运用监督学习的方法吧。不过我的类别较多，不是二元分类，但是目前的分类器都是二元的，二元的可以改造成多元分类器。有One to One 和 One to the other分类。所幸，R语言里的maxent包，本身就已经帮你做好了，且它会根据类别近似度打分，你可以得到该文档在各类别下的分数，得到排名，从而得出与之相近的多个类别。无疑是非常有用的。

制作语料库

1、我的文本数据在经过一些处理后格式就是：

文本标题(Title)	文本描述（Description)	类别(Type)
……	……	A
……	……	B
……	……	C

我是以词类作为特征的，暂时将标题也作为特征。所以先将标题和描述合并。
可通过如下函数：

BindData <- function(data)
{
  #将标题和描述合并为一个表
  temp <-

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

txHe

关注关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Arduino、ESP32驱动AHT20温湿度传感器（温湿度传感器）

不脱发的程序猿

12-06

1128

AHT20是一款MEMS半导体高精度低成本温湿度传感器。采用I2C接口，2V-5V宽电压工作范围。其稳定的性能及简洁的外围电路，使其能在恶劣环境下也能保持稳定性的工作。

AHT20温湿度传感器与LED屏显示

qq_52378452的博客

01-13

765

IIc协议实现OLED

参与评论您还未登录，请先登录后发表或查看评论

STM32温度湿度采集（AHT20)

m0_51969935的博客

11-04

3330

本文主要介绍I2C总线通信协议，STM32基于I2C协议实现AHT20温湿度传感器上位机数据采集

基于I2C的AHT20温湿度传感器的数据采集

lee_goi的博客

12-13

5231

摘要：本文先介绍一下对I2C学习的理解，然后用I2C实现AHT20进行温湿度采集文章目录摘要：一、I2C简介二、硬件I2C与软件I2C的区别三、实现I2CAHT20温湿度传感器的数据采集1、AHT20简介2、配置函数库，编写函数4、最终结果展示四、总结一、I2C简介 IC( Inter-- Integrated Circuit）总线是一种由 PHILIPS公司开发的两线式串行总线，用于连接微控制器及其外围设备。它是由数据线SDA和时钟SCL构成的串行总线，可发送和接收数据。在CPU与被控I2C之

I2C总线传输协议

大不列颠小小咸鱼

06-30

5122

一、I2C总线是一种双向的同步串行总线，它支持设备之间的短距离通信，经常用于处理器和一些外围设备之间的接口通信。I2C总线的标准通信速率是100Kbps，快速模式是400Kbps，高速模式支持3.4Mbps。I2C总线支持多设备的通信，而且各个设备之间的SCL和SDA线都是线与关系。I2C总线上扩展的器件的数量主要由电容负载来决定，其负载能力为400pF。I2C总线具有极低的电流消耗。二、I2...

AHT20温湿度传感器STM32-I2C驱动，替代DHT11/DHT12/AM2320/SHT20/SHT30，IIC代码兼容AHT10/15-MEMS温湿度传感器

最新发布

qq_46770059的博客

07-22

1151

博客文章链接：https://blog.yyzt.site/840/.html。使用硬件IIC/软件IIC和AHT20温湿度传感器通信，读取温度值和湿度值。

基于I2C的AHT20温度采集器使用及SPI协议下的OLED显示（csdn）————程序.pdf

12-05

【温度采集与显示】在项目中，使用了AHT20温湿度传感器通过I2C协议进行数据采集。AHT20是一款集成温度和湿度传感器，提供精确的环境监测数据。完整的代码（未提供链接）包含传感器的初始化、数据读取和处理。烧录...

(AHT20温度采集

AKAYY的博客

12-22

260

AHT20温度采集一、“软件I2C”和“硬件I2C”1、I2C通信协议2、硬件I2C与软件I2C的区别二、stm32f103指南者外接AHT20进行温度采集。连接硬件代码实现一、“软件I2C”和“硬件I2C” 1、I2C通信协议 1、I2C协议简介 IC( Inter-- Integrated Circuit）总线是一种由 PHILIPS公司开发的两线式串行总线，用于连接微控制器及其外围设备。它是由数据线SDA和时钟SCL构成的串行总线，可发送和接收数据。在CPU与被控I2C之间、I2C与I2C之间进行

AHT20_DEMO例程

04-18

基于I2C的AHT20温度采集器及SPI协议OLED显示

Fancy_white的博客

11-28

2417

STM32基于IIC的温湿度采集（AHT20）

古先生的博客

12-22

6963

本篇文章讲解了IIC协议的应用，区分了软件IIC和硬件IIC的区别，以及AHT20 向STM32 使用IIC 协议传输数据，并在上位机上面显示出来。 - 使用芯片：STM32F103ZET6（正点原子）、AHT20（奥松） - 实验环境：KEIL5

AHT20温湿度传感器数据采集

Uaena.&的博客

11-24

6434

目录一、I2C总线通信协议学习（一）I2C1.I2C协议简介2.I2C物理层和协议层3.硬件I2C和软件I2C（二）温湿度采集1.AHT20芯片的相关信息了解2.硬件连接3.代码实现4.烧录运行二、理解OLED屏显和汉字点阵编码原理参考文献一、I2C总线通信协议学习（一）I2C 1.I2C协议简介 I2C 通讯协议(Inter－Integrated Circuit)是由Phiilps公司开发的，由于它引脚少，硬件实现简单，可扩展性强，不需要USART、CAN等通讯协议的外部收发设备，现在被广泛地使用在系

温湿度传感器采集

qq_43656826的博客

12-22

807

，

AHT20 STM32 CUBEMX HAL库硬件IIC驱动

zhengwenbang的博客

04-19

2371

网上找了一圈AHT20 STM32 HAL库硬件驱动，没找到，索性找原工厂下了例程，修改成HAL库硬件IIC，大家可参考， AHT20.C文件内容： #include “StdLibs.h” #include “SysLibs.h” #include “AppLibs.h” float Temperature = 0.0; float Humidity = 0.0; uint8_t AHT20_Read_Status( void ) //读取AHT20的状态寄存器 { uint8_t Byte_first;

AHT20温湿度传感器的数据采集（基于I2C协议）

java_creater的博客

12-22

428

这里写目录标题一级目录二级目录三级目录一级目录二级目录三级目录

STM32下基于IIC协议的AHT20温湿度采集

weixin_45830968的博客

12-20

1187

目录一、软件I2C和硬件I2C1.软件IIC2.硬件IIC3.区别二、基于I2C的AHT20温湿数据采集1.下载所需文件1.添加.c文件2.添加文件路径3.主函数代码4.管脚连线5.运行结果一、软件I2C和硬件I2C • I2C 通讯协议(Inter－Integrated Circuit)是由 Phiilps 公司开发的，由于它引脚少，硬件实现简单，可扩展性强，不需要 USART、CAN 等通讯协议的外部收发设备现在被广泛地使用在系统内多个集成电路(IC)间的通讯。在计算机科学里，大部分复杂的问题都可以

AHT20温湿度采集（I2C协议）

山有木兮

11-20

8458

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。二、使用步骤 1.引入库代码

word无法创建工作文件,请检查临时环境变量

03-25

对不起，我是一个语言模型，无法确定您使用Word的上下文。不过，我建议您检查以下内容： 1. 检查您的计算机上的临时文件夹是否存在，并且您具有适当的访问权限。 2. 检查您的计算机上的磁盘空间是否充足。 3. 尝试清空您的临时文件夹并重新启动Word。 4. 如果上述解决方案无效，请尝试卸载并重新安装Microsoft Office。