使用Tensorflow实现图片风格迁移，圆梦名画

最新推荐文章于 2024-04-12 03:51:50 发布

Chin_style

最新推荐文章于 2024-04-12 03:51:50 发布

阅读量2.5k

点赞数 3

分类专栏：高级要求文章标签： tensorflow 风格迁移 prisma

本文链接：https://blog.csdn.net/weixin_41101173/article/details/101069924

版权

高级要求专栏收录该内容

71 篇文章 2 订阅

订阅专栏

一，前期基础知识储备

1）Prisma — 图片风格迁移的鼻祖：

照片可以记录生活的瞬间，变成一幅幅的回忆；而 Prisma 则是可以让瞬间的回忆变成永恒的名画！我们平常用手机随意拍出来的照片效果看起来都很普通，而通过 Prisma 处理之后，你一定会惊叹于它的神奇！

Pisma 是一款来自俄罗斯的照片美化应用，和「彩云天气」那样，借助人工智能技术将自身的能力提升到另一个层次。“Pisma 运用了综合人工神经网络技术（neural networks）和人工智能技术，学习模仿各种著名绘画大师和主要流派的艺术风格，然后对你的照片进行全智能的风格化处理”。

也就是说，每个滤镜最后所呈现的照片艺术效果，都是 Pisma “模仿”过去那些世界伟大艺术家们的风格，对你的照片进行 AI 智能分析之后而重绘出来的。不仅在技术上让人惊叹，实际产出的照片效果之佳，也同样让人为之惊叹！！

2）Tensorflow — 谷歌开源，实现图片风格迁移：

官方Demo地址：https://github.com/tensorflow/tensorflow/tree/master/tensorflow/examples/android

谷歌利用tensorflow一共实现了Android相关的例子有三个 —— 物体定位，行人识别，风格迁移，如图：

谷歌这里给出的实例是处理相机获得实时预览图。本篇文章的目的，是将风格迁移的效果运用到图片上。

谷歌训练的模型文件中一共有26种风格迁移的效果，下面来一一实现。

二，上代码，具体实现

1）build.gradle中添加tensorflow的依赖：

implementation 'org.tensorflow:tensorflow-android:+'

2）assets文件夹下放置谷歌训练好的模型文件：

3）对TensorFlowInferenceInterface类进行实例化：

private static final String MODEL_FILE = "stylize_quantized.pb";

... ...

inferenceInterface = new TensorFlowInferenceInterface(getAssets(), MODEL_FILE);

这里使用assets文件下的模型文件完成该类的实例化。

4）正式处理一张图片：

private void execute(final int position) {
        handler = new Handler(getMainLooper());
        inferenceInterface = new TensorFlowInferenceInterface(getAssets(), MODEL_FILE);
        runInBackground(new Runnable() {
            @Override
            public void run() {
                croppedBitmap = BitmapFactory.decodeResource(getResources(), R.drawable.beauty_1);
                croppedBitmap = Bitmap.createScaledBitmap(croppedBitmap, desiredSize, desiredSize, false);
                imageView.setImageBitmap(croppedBitmap);
                cropCopyBitmap = Bitmap.createBitmap(croppedBitmap);
                final long startTime = SystemClock.uptimeMillis();
                stylizeImage(croppedBitmap, position);
                lastProcessingTimeMs = SystemClock.uptimeMillis() - startTime;
                textureCopyBitmap = Bitmap.createBitmap(croppedBitmap);
                done();
            }
        });
    }

    private void done() {
        imageView.setImageBitmap(textureCopyBitmap);
    }

    private int desiredSize = 512;
    private final float[] styleVals = new float[NUM_STYLES];
    private int[] intValues = new int[desiredSize * desiredSize];
    private float[] floatValues = new float[desiredSize * desiredSize * 3];
    private void stylizeImage(Bitmap bitmap, int model) {
        bitmap.getPixels(intValues, 0, bitmap.getWidth(), 0, 0, bitmap.getWidth(), bitmap.getHeight());

        for (int i = 0; i < intValues.length; ++i) {
            final int val = intValues[i];
            floatValues[i * 3] = ((val >> 16) & 0xFF) / 255.0f;
            floatValues[i * 3 + 1] = ((val >> 8) & 0xFF) / 255.0f;
            floatValues[i * 3 + 2] = (val & 0xFF) / 255.0f;
        }

        for (int i = 0; i < NUM_STYLES; ++i) {
            styleVals[i] = 0f;
        }
        styleVals[model] = 1f;

        // Copy the input data into TensorFlow.
        Log.d("tensor", "Width: " + bitmap.getWidth() + ", Height: " + bitmap.getHeight());
        inferenceInterface.feed(
                INPUT_NODE, floatValues, 1, bitmap.getWidth(), bitmap.getHeight(), 3);
        inferenceInterface.feed(STYLE_NODE, styleVals, NUM_STYLES);

        inferenceInterface.run(new String[]{OUTPUT_NODE}, false);
        inferenceInterface.fetch(OUTPUT_NODE, floatValues);

        for (int i = 0; i < intValues.length; ++i) {
            intValues[i] =
                    0xFF000000
                            | (((int) (floatValues[i * 3] * 255)) << 16)
                            | (((int) (floatValues[i * 3 + 1] * 255)) << 8)
                            | ((int) (floatValues[i * 3 + 2] * 255));
        }

        bitmap.setPixels(intValues, 0, bitmap.getWidth(), 0, 0, bitmap.getWidth(), bitmap.getHeight());
    }

① 我们获取本地的一张图片，然后将其进行裁剪缩放做成一张正方形图片bitmap（512 * 512）；

② stylizeImage()方法中，接收该bitmap，同时接收一个float类型的参数，用以指定不同的风格迁移效果；

③ 注意TensorFlowInferenceInterface实例接口的三个方法（查看源码，可知）：

注入数据：feed ()方法有很多，根据需要传入参数即可，必须传入的为 intputName 和数据 src 。必须要的是传入数据的类型是什么，不然是不成功的。
运行：run()方法也有好几个，是执行运行的，需要传入 outputName 数组，这里的outputName 需要和 fetch 相关函数中的一致。
取出结果：fetch ()方法也有很多，也是需要传出的即可，必须传入的是 outputName 和要存储结果的数组 dst。必须要确定传出结果的数据类型。

得到的结果如下：

三，延伸，可运用于正式项目中

2016年，中国版的Prisma — “深黑”上线，效果和Prisma类似，但有一个致命的缺陷——只能处理正方形图片。

谷歌给出的示例中，由于模型文件本身的限制，也是只能处理一张正方形的图片。如果在上面代码中，去掉裁剪缩放的步骤，直接使用一张正方形图片，此时，跑出来的结果是报错：

java.nio.BufferOverflowException

解决方法是，将用于存储结果的数组人为扩大为两倍：

        float[] floatValues1 = new float[floatValues.length * 2];
//        inferenceInterface.fetch(OUTPUT_NODE, floatValues);
        inferenceInterface.fetch(OUTPUT_NODE, floatValues1);

        for (int i = 0; i < intValues.length; ++i) {
            intValues[i] =
                    0xFF000000
                            | (((int) (floatValues1[i * 3] * 255)) << 16)
                            | (((int) (floatValues1[i * 3 + 1] * 255)) << 8)
                            | ((int) (floatValues1[i * 3 + 2] * 255));
        }

这样处理之后，不会报错，但是得到的效果非常差：

受制于模型文件，所以不能直接使用上面的代码处理一张长方形图片，而用户大多数的图片都是长方形的，所以需要进一步的处理。

1）使用canvas——人为将长方形图片转换为正方形图片；

这里有一个非常关键的思想：谷歌的模型文件只能处理正方形图片，那我们就根据用户的图片宽高去手动构建一个正方形图片，然后在处理结果出来之后，显示之前，对图片进行裁剪，这样就可以得到一张经过正常处理的长方形图片。这一过程借助Canvas实现：

     croppedBitmap = BitmapFactory.decodeResource(getResources(), R.drawable.beauty);
     croppedBitmap = reSizeBitmap(croppedBitmap);
     croppedBitmap = Bitmap.createScaledBitmap(croppedBitmap, desiredSize, desiredSize, false);
     imageView.setImageBitmap(croppedBitmap);
    ... ...
    // 这个方法就是将一张长方形图片转换成一张正方形图片
    private Bitmap reSizeBitmap(Bitmap bitmap) {
        Bitmap b = null;
        width = bitmap.getWidth();
        height = bitmap.getHeight();
        if (width < height) {
            b = Bitmap.createBitmap(height, height, bitmap.getConfig());
            Canvas c = new Canvas(b);
            c.drawBitmap(bitmap, (height - width) / 2, 0, null);
        } else if (height < width) {
            b = Bitmap.createBitmap(width, width, bitmap.getConfig());
            Canvas c = new Canvas(b);
            c.drawBitmap(bitmap, 0, (width - height) / 2, null);
        } else if (width == height) {
            return bitmap;
        }
        return b;
    }

我们获取图片的宽高，根据长的那一边进行构建正方形。

2）处理完后，再将图片进行裁剪，裁剪完后进行显示：

    private void done() {
        if (width < height) {
            float scale = desiredSize * 1.0f / height * 1.0f;
            textureCopyBitmap = ImageUtils.clip(textureCopyBitmap, (desiredSize - Math.round(width * scale)) / 2,
                    0, Math.round(width * scale), desiredSize);
            imageView.setImageBitmap(textureCopyBitmap);
        } else {
            float scale = desiredSize * 1.0f / width * 1.0f;
            textureCopyBitmap = ImageUtils.clip(textureCopyBitmap, 0, 
                    (desiredSize - Math.round(height * scale)) / 2, desiredSize, Math.round(height * scale));
            imageView.setImageBitmap(textureCopyBitmap);
        }
    }

得到的结果如下：

第一张图，我们可以清晰的看到，真正处理的还是一张正方形图片（我们手动转换长方形图片得到的），而后进行裁剪，将多余的图片区域裁剪掉，就可以显示了。最终我们得到了想要的结果。

本项目地址（包含模型文件）：https://github.com/shenbuqingyun/stylizedImage-tensorflow

PS：谷歌训练的模型文件非常合适，大小只有550KB，却实现了26种风格滤镜效果。我在github上找到的其他个人训练的模型文件，通常都以M为单位，非常大。另外，Tensorflow在Android中的库打包时也会非常大，arm32位和64位的到有8M，这是非常惊人的大库。所以实际使用时，需要考量效果和成本。

Chin_style

关注

3
点赞
踩
32

收藏

觉得还不错? 一键收藏
1
评论
使用Tensorflow实现图片风格迁移，圆梦名画

一，前期基础知识储备1）Prisma — 图片风格迁移的鼻祖：照片可以记录生活的瞬间，变成一幅幅的回忆；而Prisma则是可以让瞬间的回忆变成永恒的名画！我们平常用手机随意拍出来的照片效果看起来都很普通，而通过 Prisma 处理之后，你一定会惊叹于它的神奇！Pisma是一款来自俄罗斯的照片美化应用，和「彩云天气」那样，借助人工智能技术将自身的能力提升到另一个层次。“P...
复制链接

扫一扫