php 向量计算,PHP计算文档频率与特征向量

最新推荐文章于 2024-06-15 01:16:17 发布

Fayyy Li

最新推荐文章于 2024-06-15 01:16:17 发布

阅读量169

点赞数

文章标签：文档处理分词正则表达式文档频率特征向量

步骤：

(1)读取3篇txt格式的英文文档；

(2)对每篇文档进行分词；

(3)利用正则表达式去掉逗号、句号等标点符号；

(4)计算文档频率；

(5)统计特征向量<?php

$_txts = array('1.txt','2.txt','3.txt');

$_len = count($_txts);

for ($i = 0;$i

$_contents[] = file_get_contents($_txts[$i]);

}

for ($i = 0;$i

//分词

$_words[] = explode(' ',trim($_contents[$i]));

foreach ($_words[$i] as $_key=>$_value){

$_value = trim($_value);

$_value = preg_replace('/[.|,|(|)|-|;]/','',$_value);

$_words[$i][$_key]=strtolower($_value);

}

//去重

$_words[$i]= array_unique($_words[$i]);

}

//合并

$_words_com = array_merge($_words[0],$_words[1],$_words[2]);

//文档频率

$_df = array_count_values($_words_com);

//特征向量

for ($i = 0;$i

$_vsm[$i] = $_df;

foreach($_vsm[$i] as $_key=>$_value){

$_vsm[$i][$_key] = 0;

}

for ($j=0;$j

if (in_array($_words[$i][$j],$_words_com)){

$_vsm[$i][($_words[$i][$j])] +=1;

}

for($i = 0;$i

echo '第'.($i+1).'篇文档的特征向量: ('. implode(",",$_vsm[$i]).')
';

}

print_r($_df);

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Fayyy Li

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

PHP实现向量积(附完整源码)

希望我的博客，能帮上你解决学习中工作中所遇到的问题

04-17

PHP实现向量积(附完整源码)

在线图书销售系统详细设计与具体代码实现

程序员光剑

04-21

1024

在线图书销售系统详细设计与具体代码实现 1. 背景介绍 1.1 电子商务的兴起随着互联网技术的快速发展,电子商务(E-commerce)应运而生,成为了一种全新的商业模式。电子商务打破了传统商业活动的地理限制,为消费者提供了更加便捷

参与评论您还未登录，请先登录后发表或查看评论

PHP计算文档频率与特征向量

weixin_34381666的博客

03-21

112

步骤：（1）读取3篇txt格式的英文文档；（2）对每篇文档进行分词；（3）利用正则表达式去掉逗号、句号等标点符号；（4）计算文档频率；（5）统计特征向量<?php $_txts = array('1.txt','2.txt','3.txt'); $_len = count($_txts); for ($i = 0;$i < $_l...

php中向量化编程_PHP中的防御性编程

culi4814的博客

08-29

224

php中向量化编程Finagle’s Law of Dynamic Negatives: Anything that can go wrong, will – at the worst possible moment. Finagle的动态负数定律：在最糟糕的时刻，任何会出错的都会。 “防御性编程”是什么意思？ (What Does “Defensive Programming” Me...

PHP数据分析引擎计算余弦相似度算法示例

10-19

例如，如果你有两篇文章的关键词频率向量，可以这样操作： ```php $vectorA = array(1, 2, 3, 0, 1); $vectorB = array(0, 2, 1, 4, 1); $indexA = handIndex($vectorA, 'j'); $indexB = handIndex($vectorB, 'k')...

mahout学习之聚类（1）——向量的引入与距离测度

kevinjqy的专栏

10-03

733

聚类的基本概念聚类就是将一个给定的文档集中的相似项目分成不同簇的过程，可以将簇看作一组簇内相似而簇间有别的项目的集合。对文档集的聚类涉及以下三件事： 1. 一个算法：将文档集阻止到一起的算法 2. 相似性与不相似的概念 3. 停止的条件聚类数据的表示mahout将输入数据以向量的形式保存，在机器学习领域，向量指一个有序的数列，有多个维度，每个维度都有一个值。比如在二维空间，一个坐标就是一个

计算机视觉新手指南

TensorFlowNews

04-23

1869

通过机器的眼睛去探索如果我们想让机器学会思考，就需要教他们学会如何用视觉去看周围环境。—— 斯坦福大学AI实验室和斯坦福视觉实验室主任李飞飞使计算机或手机等机器看到周围环境的现象称为计算机视觉。机器仿生人眼的研究工作可以追溯到50年代，从那时起，我们已经走了很长一段路。计算机视觉技术已经通过不同的电子商务领域以及相机应用程序进入了我们的手机。想一想当机器能够像人眼一样准确地看到周围环境...

倒排索引原理与代码实例讲解

最新发布

程序员光剑

06-15

434

倒排索引原理与代码实例讲解 1. 背景介绍 1.1 什么是倒排索引倒排索引(Inverted Index)是一种常用于全文搜索引擎的索引结构。它存储了单词到文档的映射关系,可以根据单词快速找到包含该单词的文档。

第四章 php数学运算

10-28

数字或数值数据在PHP中一般就两种double和int。PHP是一种松散类型的脚本语言，要注意类型转换的方式

php计算多个集合的笛卡尔积实例详解

12-19

笛卡尔积笛卡尔积是指在数学中，两个集合X和Y的笛卡尔积(Cartesian product)，又称直积，表示为X*Y，第一个对象是X的成员而第二个对象是Y的所有可能有序对的其中一个成员。假设集合A={a,b}，集合B={0,1,2}，则两个集合的笛卡尔积为{(a,0),(a,1),(a,2),(b,0),(b,1),(b,2)} 实现思路先计算第一个集合和第二个集合的笛卡尔积，把结果保存为一个新集合。然后再用新集合与下一个集合计算笛卡尔积，依此循环直到与最后一个集合计算笛卡尔积。例如有以下几个集合，需要计算笛卡尔积 <?php $sets = array( array('白色

向量

yichudu

08-08

1042

既有大小又有方向的量。二维、三维空间中有相应的几何意义，可以继续往高维推广。向量加法对应维度相加。向量乘法内积两向量内积为对应分量乘积的和。向量a⃗与b⃗\vec a与\vec b对应两个行矩阵A与B，那么 a⃗⋅b⃗=AT⋅B\vec a\cdot \vec b=A^T\cdot B。抛开矩阵，那么a⃗⋅b⃗=∑mi=1(xi⋅yi)\vec a\cdot \vec b=\sum

向量的基本运算

weixin_33748818的博客

03-08

494

摘自马同学高等数学数乘和加法被称为向量的，运算后的结果仍然是向量，并且维度也没有发生改变。不难看出，加法满足交换律，结合律：交换律：结合律：数乘满足交换律，结合律和分配率的：交换律：结合律：分配律：...

php 3des 向量,PHP 3DES 加解密（CBC模式，pkcs5padding填充）

weixin_29190573的博客

03-16

445

1、前言：项目中接入第三方支付遇到3DES加密，以前也没用过，搜了好多，都不适用，各种不对，后来自己结合搜到的终于弄正确了，检测地址：http://tool.chacuo.net/crypt3des。2、下面是类适用(CBC加密模式，pkcs5padding填充)代码：/*** @des 3DES加密算法,cbc模式,pkcs5Padding字符填充方式*/class TDEA{/*** @pa...

PHP实现求两个向量的叉积向量(3D vectors)算法（附完整源码）

希望我的博客，能帮上你解决学习中工作中所遇到的问题

04-19

149

PHP实现求两个向量的叉积向量(3D vectors)算法（附完整源码）

向量数据库介绍

TYLZVS007的博客

08-09

1973

本文是向量数据库的科普文，介绍了向量数据库的概念、应用场景、选择向量数据库产品的考虑点，最后以PostgreSQL向量扩展示例展示向量数据库的使用。

矢量（向量）

菜鸡Jacky0705的CSDN博客

07-30

4930

计算几何初步一、计算几何的恶心之处1、有精度误差2、要讨论各种边界情况3、代码长二、矢量1、矢量的定义2、矢量的表示及其相关量的表示(1)矢量的表示(2)矢量夹角的表示3、矢量的运算(1)向量的模(2)矢量的加法(3)矢量的减法(4)矢量的点乘(5)矢量的叉乘4、矢量的变换(1)缩放一、计算几何的恶心之处 1、有精度误差计算几何中，有很多时候需要复杂的浮点运算和三角函数，所以，我们需要一个小量...

幂法与反幂法：计算矩阵特征值与特征向量

本文主要讨论了在数值计算中如何使用幂法和反幂法来求解矩阵的最大和最小特征值，以及对应的特征向量。首先，幂法是基于矩阵的幂次迭代来逼近最大特征值。当矩阵A满足有n个线性无关的特征向量条件时，幂法通过计算...