Stranssen算法的实现与优化

本文通过实验对比了普通矩阵乘法和Stranssen算法的性能,并对Stranssen算法进行改进以适应非2^n维度,展示了两种方法在不同规模下的运行时间和复杂度
摘要由CSDN通过智能技术生成

通过本实验,比较并验证了普通矩阵算法和Stranssen算法的运行效率及时间复杂度,并对Stranssen算法进行了改进,使之适应非2^n的情况
 

#include <iostream>
#include <vector>
#include <ctime>
#include <cstdlib>
#include <chrono>

using namespace std;
using namespace std::chrono;

vector<vector<int>> generateRandomMatrix(int N, int s, int t) {
    vector<vector<int>> matrix(N, vector<int>(N));
    for (int i = 0; i < N; ++i) {
        for (int j = 0; j < N; ++j) {
            matrix[i][j] = rand() % (t - s + 1) + s;
        }
    }
    return matrix;
}

void printMatrix(const vector<vector<int>>& matrix) {
    for (const auto& row : matrix) {
        for (int val : row) {
            cout << val << " ";
        }
        cout << endl;
    }
}

vector<vector<int>> subtractMatrices(const vector<vector<int>>& A, const vector<vector<int>>& B) {
    int n = A.size();
    vector<vector<int>> result(n, vector<int>(n));

    for (int i = 0; i < n; ++i) {
        for (int j = 0; j < n; ++j) {
            result[i][j] = A[i][j] - B[i][j];
        }
    }

    return result;
}

vector<vector<int>> addMatrices(const vector<vector<int>>& A, const vector<vector<int>>& B) {
    int n = A.size();
    vector<vector<int>> result(n, vector<int>(n));

    for (int i = 0; i < n; ++i) {
        for (int j = 0; j < n; ++j) {
            result[i][j] = A[i][j] + B[i][j];
        }
    }

    return result;
}

vector<vector<int>> matrixMultiplication(const vector<vector<int>>& A, const vector<vector<int>>& B) {
    int n = A.size();
    vector<vector<int>> result(n, vector<int>(n, 0));

    for (int i = 0; i < n; ++i) {
        for (int j = 0; j < n; ++j) {
            for (int k = 0; k < n; ++k) {
                result[i][j] += A[i][k] * B[k][j];
            }
        }
    }

    return result;
}

vector<vector<int>> strassenMatrixMultiplication(const vector<vector<int>>& A, const vector<vector<int>>& B) {
    int n = A.size();
    vector<vector<int>> result(n, vector<int>(n, 0));

    if (n == 1) {
        result[0][0] = A[0][0] * B[0][0];
    } else {
        int half = n / 2;

        vector<vector<int>> A11(half, vector<int>(half));
        vector<vector<int>> A12(half, vector<int>(half));
        vector<vector<int>> A21(half, vector<int>(half));
        vector<vector<int>> A22(half, vector<int>(half));
        vector<vector<int>> B11(half, vector<int>(half));
        vector<vector<int>> B12(half, vector<int>(half));
        vector<vector<int>> B21(half, vector<int>(half));
        vector<vector<int>> B22(half, vector<int>(half));

        // Divide A and B into 4 sub-matrices
        for (int i = 0; i < half; ++i) {
            for (int j = 0; j < half; ++j) {
                A11[i][j] = A[i][j];
                A12[i][j] = A[i][j + half];
                A21[i][j] = A[i + half][j];
                A22[i][j] = A[i + half][j + half];

                B11[i][j] = B[i][j];
                B12[i][j] = B[i][j + half];
                B21[i][j] = B[i + half][j];
                B22[i][j] = B[i + half][j + half];
            }
        }

        vector<vector<int>> P1 = strassenMatrixMultiplication(A11, subtractMatrices(B12, B22));
        vector<vector<int>> P2 = strassenMatrixMultiplication(addMatrices(A11, A12), B22);
        vector<vector<int>> P3 = strassenMatrixMultiplication(addMatrices(A21, A22), B11);
        vector<vector<int>> P4 = strassenMatrixMultiplication(A22, subtractMatrices(B21, B11));
        vector<vector<int>> P5 = strassenMatrixMultiplication(addMatrices(A11, A22), addMatrices(B11, B22));
        vector<vector<int>> P6 = strassenMatrixMultiplication(subtractMatrices(A12, A22), addMatrices(B21, B22));
        vector<vector<int>> P7 = strassenMatrixMultiplication(subtractMatrices(A11, A21), addMatrices(B11, B12));

        vector<vector<int>> C11 = addMatrices(subtractMatrices(addMatrices(P5, P4), P2), P6);
        vector<vector<int>> C12 = addMatrices(P1, P2);
        vector<vector<int>> C21 = addMatrices(P3, P4);
        vector<vector<int>> C22 = subtractMatrices(subtractMatrices(addMatrices(P5, P1), P3), P7);

        for (int i = 0; i < half; ++i) {
            for (int j = 0; j < half; ++j) {
                result[i][j] = C11[i][j];
                result[i][j + half] = C12[i][j];
                result[i + half][j] = C21[i][j];
                result[i + half][j + half] = C22[i][j];
            }
        }
    }

    return result;
}

int main() {
    srand(time(0));

    
    vector<int> sizes = {1024, 2048,4096,8192,16384}; 
    int s = 1; 
    int t = 10; 

    for (int N : sizes) {
        
        vector<vector<int>> A = generateRandomMatrix(N, s, t);
        vector<vector<int>> B = generateRandomMatrix(N, s, t);

       
        auto start = high_resolution_clock::now();
        matrixMultiplication(A, B);
        auto stop = high_resolution_clock::now();
        auto duration = duration_cast<microseconds>(stop - start);
        cout << "Normal Matrix Multiplication for size " << N << ": " << duration.count() << " microseconds" << endl;

        
        start = high_resolution_clock::now();
        strassenMatrixMultiplication(A, B);
        stop = high_resolution_clock::now();
        duration = duration_cast<microseconds>(stop - start);
        cout << "Strassen's Matrix Multiplication for size " << N << ": " << duration.count() << " microseconds" << endl;
    }

    return 0;
}

改进版
再main函数前加入补0的函数

void pad_matrix(int n, int **original, int **padded) {
    int padded_n = 1;
    while (padded_n < n) {
        padded_n *= 2;    
}
    for (int i = 0; i < n; i++) {
        for (int j = 0; j < n; j++) {
            padded[i][j] = original[i][j];
        }
    }
    for (int i = n; i < padded_n; i++) {
        for (int j = 0; j < padded_n; j++) {
            padded[i][j] = 0;
        }
    }
    for (int i = 0; i < padded_n; i++) {
        for (int j = n; j < padded_n; j++) {
            padded[i][j] = 0;
        }
    }
}

  • 8
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Apriori算法是一种经典的频繁项集挖掘算法,用于发现数据集中的频繁项集。它的基本思想是通过迭代的方式,从数据集中找到所有的频繁项集。Apriori算法的核心思想是利用候选集的包含关系,通过减少候选集的规模来加快算法运行速度。 Apriori算法的基本流程如下: 1. 扫描数据集,得到所有的候选项集。 2. 计算所有候选项集的支持度,保留支持度大于等于最小支持度阈值的项集。 3. 由保留的频繁项集生成新的候选项集,并重复步骤2和3,直到没有更多的频繁项集被发现。 Apriori算法的主要优化方法有以下几种: 1. 剪枝策略 可以通过剪枝策略来减少候选项集的数量,从而加快算法的执行速度。可以使用Apriori原理,即一个频繁项集的子集一定是频繁项集,来减少候选项集的生成。 2. 支持度计数 可以利用数据集的特点,例如可以使用哈希表来快速计算每个项集的支持度,避免了多次扫描数据集的开销。 3. 数据结构优化 可以使用多种数据结构来存储候选项集和频繁项集,例如使用树结构或位图来存储项集,从而减少内存的使用和查询时间。 4. 并行计算 可以使用多线程或分布式计算的技术,将数据集分成多个部分并行计算,从而加快算法的执行速度。 总之,Apriori算法实现优化是一个非常重要的研究方向,可以通过不同的优化方法来提高算法的性能,从而更好地处理大规模数据集的挖掘任务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值