动态规划经典题目-数据压缩之文本压缩

一、题目描述

​ 考虑如下数据压缩技术。我们有一个表存了m个文本串,每个长度至多为k。我们想对一个长为n的数据串D使用尽可能少的文本串来编码。例如,如果我们的表包含(“a”,“ba”,“abab", “b"), 且数据串为“bababbaababa" ,编码的最好方式是(“b”,“abab”, “ba” ,“abab”,“a”)一共计5个码字. 给出一个O(nmk)算法找出最优编码的码长。你可以假设每个文本串都可以基于该表至少给出一个编码。

示例:

输入:codes = ["a","ba","abab","b"] str = "bababbaababa"
输出:5
解释:编码的最好方式是(“b”,“abab”, “ba” ,“abab”,“a”)

二、解题思路

1. 定义状态

​ 设dp[i]表示字符串前i个字符组成的字符串最优码长,i从1开始计数,那么我们最终要求出的是dp[str.length]即为字符串str的最优码长;

​ 我们假设k <= i,假设字符串i的后k个字符串与编码相匹配,则有dp[i] = dp[i - k] + 1 ,当然k值可能有多个(多个编码匹配),我们取最小花费那个。

2. 定义状态转移方程

当k <= j并且字符串后k个字符组成字符串与编码匹配时, k为编码集中编码长度组成的集合,有

d p [ i ] = m i n ( d p [ i − k ] + 1 ) , dp[i] = min( dp[i - k] + 1), dp[i]=min(dp[ik]+1),

3. 初始化

​ 当 i = 1时,有 d p [ 1 ] = 1 dp[1] = 1 dp[1]=1

4. 计算方式

​ 自左向右计算

三、代码实现

/**
 * 最优编码数量
 *
 *  @author hh
 *  @date 2021-5-20 21:48
 */
public class OptimumCode {

    public int optimumCode(String[] codes,String str,String[] trace){
        int[] dp = new int[str.length() + 1];
        //初始化dp[1] = 1
        dp[1] = 1;
        for(int i = 1; i <= str.length(); i++){
            dp[i] = Integer.MAX_VALUE;
            for(String bizCode : codes){
                if(bizCode.length() > i){
                    continue;
                }
                int temp = dp[i - bizCode.length()] + 1;
                if(str.substring(i - bizCode.length(),i).equals(bizCode) && dp[i] > temp){
                    dp[i] = temp;
                    trace[i] = bizCode;
                }
            }
        }
        return dp[str.length()];
    }

    public void print(String[] trace,int index){
        Stack<String> stringStack = new Stack<>();
        while (index >= 1){
            stringStack.push(trace[index]);
            index -= trace[index].length();
        }
        System.out.print("最优编码为:");
        while (!stringStack.isEmpty()){
            if(stringStack.size() == 1){
                System.out.print(stringStack.pop());
            }else{
                System.out.print(stringStack.pop() + ",");
            }
        }
    }

    public static void main(String[] args){
        String[] codes = new String[]{"a","ba","abab","b"};
        String str = "bababbaababa";
        String[] trace = new String[str.length() + 1];
        OptimumCode optimumCode = new OptimumCode();
        System.out.println("最优编码长度:" +  optimumCode.optimumCode(codes,str,trace));
        optimumCode.print(trace,str.length());
    }
}

四、执行结果

在这里插入图片描述

五、思考

​ 本题和图像压缩的做法非常相似,都是对dp数组进行线性划分,读者有时间可以看我的另一篇文章动态规划经典题目-数据压缩之图像压缩,进行举一反三。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值