【Linux】下跨语言调用【C++,逆袭面经分享

先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7

深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年最新Web前端全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
img
img
img
img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上前端开发知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

如果你需要这些资料,可以添加V获取:vip1024c (备注前端)
img

正文

extern “C” {

void str_print(const char* text) {

StrPrint cpp_ins;

std::string str = text;

cpp_ins.print(str);

}

}




#### []( )3.1.3 生成动态库



为了支持Python与Java的跨语言调用,我们需要对封装好的接口生成动态库,生成动态库的方式有以下三种



*   **方式一**:源码依赖方式,将c\_wrapper和C++代码一起编译生成`libstr_print.so`。这种方式业务方只需要依赖一个so,使用成本较小,但是需要获取到源码。对于一些现成的动态库,可能不适用。



g++ -o libstr_print.so str_print.cpp c_wrapper.cpp -fPIC -shared




*   **方式二**:动态链接方式,这种方式生成的`libstr_print.so`,发布时需要携带上其依赖库`libstr_print_cpp.so`。 这种方式,业务方需要同时依赖两个so,使用的成本相对要高,但是不必提供原动态库的源码。



g++ -o libstr_print.so c_wrapper.cpp -fPIC -shared -L. -lstr_print_cpp




*   **方式三**:静态链接方式,这种方式生成的`libstr_print.so`,发布时无需携带上`libstr_print_cpp.so`。 这种方式,业务方只需依赖一个so,不必依赖源码,但是需要提供静态库。



g++ c_wrapper.cpp libstr_print_cpp.a -fPIC -shared -o libstr_print.so




上述三种方式,各自有适用场景和优缺点。在我们本次的业务场景下,因为工具库与封装库均由我们自己开发,能够获取到源码,因此选择第一种方式,业务方依赖更加简单。



#### []( )3.1.4 Python接入代码



Python标准库自带的ctypes可以实现加载C的动态库的功能,使用方法如下:



str\_print.py



-- coding: utf-8 --

import ctypes

加载 C lib

lib = ctypes.cdll.LoadLibrary(“./libstr_print.so”)

接口参数类型映射

lib.str_print.argtypes = [ctypes.c_char_p]

lib.str_print.restype = None

调用接口

lib.str_print(‘Hello World’)




LoadLibrary会返回一个指向动态库的实例,通过它可以在Python里直接调用该库中的函数。argtypes与restype是动态库中函数的参数属性,前者是一个ctypes类型的列表或元组,用于指定动态库中函数接口的参数类型,后者是函数的返回类型(默认是c\_int,可以不指定,对于非c\_int型需要显示指定)。该部分涉及到的参数类型映射,以及如何向函数中传递struct、指针等高级类型,可以参考附录中的文档。



#### []( )3.1.5 Java接入代码



Java调用C lib有JNI与JNA两种方式,从使用便捷性来看,更推荐JNA方式。



##### []( )3.1.5.1 JNI接入



Java从1.1版本开始支持JNI接口协议,用于实现Java语言调用C/C++动态库。JNI方式下,前文提到的c\_wrapper模块不再适用,JNI协议本身提供了适配层的接口定义,需要按照这个定义进行实现。JNI方式的具体接入步骤为:



Java代码里,在需要跨语言调用的方法上,增加native关键字,用以声明这是一个本地方法。



import java.lang.String;

public class JniDemo {

public native void print(String text);

}




通过javah命令,将代码中的native方法生成对应的C语言的头文件。这个头文件类似于前文提到的c\_wrapper作用。



javah JniDemo




得到的头文件如下(为节省篇幅,这里简化了一些注释和宏):



#include <jni.h>

#ifdef __cplusplus

extern “C” {

#endif

JNIEXPORT void JNICALL Java_JniDemo_print

(JNIEnv *, jobject, jstring);

#ifdef __cplusplus

}

#endif




jni.h在JDK中提供,其中定义了Java与C语言调用所必需的相关实现。



JNIEXPORT和JNICALL是JNI中定义的两个宏,JNIEXPORT标识了支持在外部程序代码中调用该动态库中的方法,JNICALL定义了函数调用时参数的入栈出栈约定。



`Java_JniDemo_print`是一个自动生成的函数名,它的格式是固定的由`Java_{className}_{methodName}`构成,JNI会按照这个约定去注册Java方法与C函数的映射。



三个参数里,前两个是固定的。JNIEnv中封装了jni.h 里的一些工具方法,jobject指向Java中的调用类,即JniDemo,通过它可以找到Java里class中的成员变量在C的堆栈中的拷贝。 jstring 指向传入参数 text,这是对于Java 中String类型的一个映射。有关类型映射的具体内容,会在后文详细展开。



编写实现`Java_JniDemo_print`方法。



JniDemo.cpp



#include

#include “JniDemo.h”

#include “str_print.h”

JNIEXPORT void JNICALL Java_JniDemo_print (JNIEnv *env, jobject obj, jstring text)

{

char* str=(char*)env->GetStringUTFChars(text,JNI_FALSE);

std::string tmp = str;

StrPrint ins;

ins.print(tmp);

}




编译生成动态库。



g++ -o libJniDemo.so JniDemo.cpp str_print.cpp -fPIC -shared -I< J A V A H O M E > / i n c l u d e / − I < JAVA_HOME>/include/ -I< JAVAHOME>/include/I<JAVA_HOME>/include/linux




编译运行。



java -Djava.library.path=<path_to_libJniDemo.so> JniDemo




JNI机制通过一层C/C++ 的桥接,实现了跨语言调用协议。这一功能在Android系统中一些图形计算相关的Java程序下有着大量应用。一方面能够通过Java调用大量操作系统底层库,极大的减少了JDK上的驱动开发的工作量,另一方面能够更充分的利用硬件性能。但是通过3.1.5.1中的描述也可以看到,JNI的实现方式本身的实现成本还是比较高的。尤其桥接层的C/C++代码的编写,在处理复杂类型的参数传递时,开发成本较大。为了优化这个过程,Sun公司主导了JNA(Java Native Access)开源工程的工作。



##### []( )3.1.5.2 JNA接入



JNA是在JNI基础上实现的编程框架,它提供了C语言动态转发器,实现了Java类型到C类型的自动转换。因此,Java开发人员只要在一个Java接口中描述目标native library的函数与结构,不再需要编写任何Native/JNI代码,极大的降低了Java调用本地共享库的开发难度。



JNA的使用方法如下:



在Java项目中引入JNA库。



com.sun.jna

jna

5.4.0




声明与动态库对应的Java接口类。



public interface CLibrary extends Library {

void str_print(String text); // 方法名和动态库接口一致,参数类型需要用Java里的类型表示,执行时会做类型映射,原理介绍章节会有详细解释

}




加载动态链接库,并实现接口方法。



JnaDemo.java



package com.jna.demo;

import com.sun.jna.Library;

import com.sun.jna.Native;

public class JnaDemo {

private CLibrary cLibrary;

public interface CLibrary extends Library {

    void str_print(String text);

}



public JnaDemo() {

    cLibrary = Native.load("str_print", CLibrary.class);

}



public void str_print(String text)

{

    cLibrary.str_print(text);

}

}




对比可以发现,相比于JNI,JNA不再需要指定native关键字,不再需要生成JNI部分C代码,也不再需要显示的做参数类型转化,极大地提高了调用动态库的效率。



### []( )3.2 打包发布



为了做到开箱即用,我们将动态库与对应语言代码打包在一起,并自动准备好对应依赖环境。这样使用方只需要安装对应的库,并引入到工程中,就可以直接开始调用。这里需要解释的是,我们没有将so发布到运行机器上,而是将其和接口代码一并发布至代码仓库,原因是我们所开发的工具代码可能被不同业务、不同背景(非C++)团队使用,不能保证各个业务方团队都使用统一的、标准化的运行环境,无法做到so的统一发布、更新。



#### []( )3.2.1 Python 包发布



Python可以通过setuptools将工具库打包,发布至pypi公共仓库中。具体操作方法如下:



创建目录。



.

├── MANIFEST.in #指定静态依赖

├── setup.py # 发布配置的代码

└── strprint # 工具库的源码目录

  ├── __init__.py        # 工具包的入口

  └── libstr_print.so    # 依赖的c_wrapper 动态库



编写**init**.py, 将上文代码封装成方法。



-- coding: utf-8 --

import ctypes

import os

import sys

dirname, _ = os.path.split(os.path.abspath(file))

lib = ctypes.cdll.LoadLibrary(dirname + “/libstr_print.so”)

lib.str_print.argtypes = [ctypes.c_char_p]

lib.str_print.restype = None

def str_print(text):

  lib.str_print(text)



编写setup.py。



from setuptools import setup, find_packages

setup(

  name="strprint",

  version="1.0.0",

  packages=find_packages(),

  include_package_data=True,

  description='str print',

  author='xxx',

  package_data={

      'strprint': ['*.so']

  },

)




编写MANIFEST.in。



include strprint/libstr_print.so




打包发布。



python setup.py sdist upload




#### []( )3.2.2 Java接口



对于Java接口,将其打包成JAR包,并发布至Maven仓库中。



编写封装接口代码`JnaDemo.java`。



package com.jna.demo;

import com.sun.jna.Library;

import com.sun.jna.Native;

import com.sun.jna.Pointer;

public class JnaDemo {

  private CLibrary cLibrary;

  public interface CLibrary extends Library {

      Pointer create();

      void str_print(String text);

  }



  public static JnaDemo create() {

      JnaDemo jnademo = new JnaDemo();

      jnademo.cLibrary = Native.load("str_print", CLibrary.class);

      //System.out.println("test");

      return jnademo;

  }



  public void print(String text)

  {

      cLibrary.str_print(text);

  }

}




创建resources目录,并将依赖的动态库放到该目录。



通过打包插件,将依赖的库一并打包到JAR包中。



<artifactId>maven-assembly-plugin</artifactId>

<configuration>

    <appendAssemblyId>false</appendAssemblyId>

    <descriptorRefs>

        <descriptorRef>jar-with-dependencies</descriptorRef>

    </descriptorRefs>

</configuration>

<executions>

    <execution>

        <id>make-assembly</id>

        <phase>package</phase>

        <goals>

            <goal>assembly</goal>

        </goals>

    </execution>

</executions>



### []( )3.3 业务使用



#### []( )3.3.1 Python使用



安装strprint包。



pip install strprint==1.0.0




使用示例:



-- coding: utf-8 --

import sys

from strprint import *

str_print(‘Hello py’)




#### []( )3.3.2 Java使用



pom引入JAR包。



  <groupId>com.jna.demo</groupId>

  <artifactId>jnademo</artifactId>

  <version>1.0</version>



使用示例:



JnaDemo jnademo = new JnaDemo();

jnademo.str_print(“hello jna”);




### []( )3.4 易用性优化



#### []( )3.4.1 Python版本兼容



Python2与Python3版本的问题,是Python开发用户一直诟病的槽点。因为工具面向不同的业务团队,我们没有办法强制要求使用统一的Python版本,但是我们可以通过对工具库做一下简单处理,实现两个版本的兼容。Python版本兼容里,需要注意两方面的问题:



*   语法兼容

*   数据编码



Python代码的封装里,基本不牵扯语法兼容问题,我们的工作主要集中在数据编码问题上。由于Python 3的str类型使用的是unicode编码,而在C中,我们需要的char\* 是utf8编码,因此需要对于传入的字符串做utf8编码处理,对于C语言返回的字符串,做utf8转换成unicode的解码处理。于是对于上例子,我们做了如下改造:



-- coding: utf-8 --

import ctypes

import os

import sys

dirname, _ = os.path.split(os.path.abspath(file))

lib = ctypes.cdll.LoadLibrary(dirname + “/libstr_print.so”)

lib.str_print.argtypes = [ctypes.c_char_p]

lib.str_print.restype = None

def is_python3():

return sys.version_info[0] == 3

def encode_str(input):

if is_python3() and type(input) is str:

    return bytes(input, encoding='utf8')

return input

def decode_str(input):

if is_python3() and type(input) is bytes:

    return input.decode('utf8')

return input

def str_print(text):

lib.str_print(encode_str(text))



#### []( )3.4.2 依赖管理



在很多情况下,我们调用的动态库,会依赖其它动态库,比如当我们依赖的gcc/g++版本与运行环境上的不一致时,时常会遇到`glibc_X.XX not found`的问题,这时需要我们提供指定版本的`libstdc.so`与`libstdc++.so.6`。



为了实现开箱即用的目标,在依赖并不复杂的情况下,我们会将这些依赖也一并打包到发布包里,随工具包一起提供。对于这些间接依赖,在封装的代码里,并不需要显式的load,因为Python与Java的实现里,加载动态库,最终调用的都是系统函数dlopen。这个函数在加载目标动态库时,会自动的加载它的间接依赖。所以我们所需要做的,就只是将这些依赖放置到dlopen能够查找到路径下。



dlopen查找依赖的顺序如下:



1.  从dlopen调用方ELF(Executable and Linkable Format)的DT\_RPATH所指定的目录下寻找,ELF是so的文件格式,这里的DT\_RPATH是写在动态库文件的,常规手段下,我们无法修改这个部分。

2.  从环境变量LD\_LIBRARY\_PATH所指定的目录下寻找,这是最常用的指定动态库路径的方式。

3.  从dlopen调用方ELF的DT\_RUNPATH所指定的目录下寻找,同样是在so文件中指定的路径。

4.  从/etc/ld.so.cache寻找,需要修改/etc/ld.so.conf文件构建的目标缓存,因为需要root权限,所以在实际生产中,一般很少修改。

5.  从/lib寻找, 系统目录,一般存放系统依赖的动态库。

6.  从/usr/lib寻找,通过root安装的动态库,同样因为需要root权限,生产中,很少使用。



从上述查找顺序中可以看出,对于依赖管理的最好方式,是通过指定`LD_LIBRARY_PATH`变量的方式,使其包含我们的工具包中的动态库资源所在的路径。另外,对于Java程序而言,我们也可以通过指定`java.library.path`运行参数的方式来指定动态库的位置。Java程序会将`java.library.path`与动态库文件名拼接到一起作为绝对路径传递给dlopen,其加载顺序排在上述顺序之前。



最后,在Java中还有一个细节需要注意,我们发布的工具包是以JAR包形式提供,JAR包本质上是一个压缩包,在Java程序中,我们能够直接通过`Native.load()`方法,直接加载位于项目resources目录里的so,这些资源文件打包后,会被放到JAR包中的根目录。



但是dlopen无法加载这个目录。对于这一问题,最好的方案可以参考【2.1.3 生成动态库】一节中的打包方法,将依赖的动态库合成一个so,这样无须做任何环境配置,开箱即用。但是对于诸如`libstdc++.so.6`等无法打包在一个so的中系统库,更为通用的做法是,在服务初始化时将so文件从JAR包中拷贝至本地某个目录,并指定`LD_LIBRARY_PATH`包含该目录。



[]( )4\. 原理介绍

--------------------------------------------------------------------



### []( )4.1 为什么需要一个c\_wrapper



实现方案一节中提到Python/Java不能直接调用C++接口,要先对C++中对外提供的接口用C语言的形式进行封装。这里根本原因在于使用动态库中的接口前,需要根据函数名查找接口在内存中的地址,动态库中函数的寻址通过系统函数dlsym实现,dlsym是严格按照传入的函数名寻址。



在C语言中,函数签名即为代码函数的名称,而在C++语言中,因为需要支持函数重载,可能会有多个同名函数。为了保证签名唯一,C++通过name mangling机制为相同名字不同实现的函数生成不同的签名,生成的签名会是一个像\_\_Z4funcPN4printE这样的字符串,无法被dlsym识别(注:Linux系统下可执行程序或者动态库多是以ELF格式组织二进制数据,其中所有的非静态函数(non-static)以“符号(symbol)”作为唯一标识,用于在链接过程和执行过程中区分不同的函数,并在执行时映射到具体的指令地址,这个“符号”我们通常称之为函数签名)。



为了解决这个问题,我们需要通过extern “C” 指定函数使用C的签名方式进行编译。因此当依赖的动态库是C++库时,需要通过一个c\_wrapper模块作为桥接。而对于依赖库是C语言编译的动态库时,则不需要这个模块,可以直接调用。



### []( )4.2 跨语言调用如何实现参数传递



C/C++函数调用的标准过程如下:



1.  在内存的栈空间中为被调函数分配一个栈帧,用来存放被调函数的形参、局部变量和返回地址。

2.  将实参的值复制给相应的形参变量(可以是指针、引用、值拷贝)。

3.  控制流转移到被调函数的起始位置,并执行。

4.  控制流返回到函数调用点,并将返回值给到调用方,同时栈帧释放。



由以上过程可知,函数调用涉及内存的申请释放、实参到形参的拷贝等,Python/Java这种基于虚拟机运行的程序,在其虚拟机内部也同样遵守上述过程,但涉及到调用非原生语言实现的动态库程序时,调用过程是怎样的呢?



由于Python/Java的调用过程基本一致,我们以Java的调用过程为例来进行解释,对于Python的调用过程不再赘述。



#### []( )4.2.1 内存管理



在Java的世界里,内存由JVM统一进行管理,JVM的内存由栈区、堆区、方法区构成,在较为详细的资料中,还会提到native heap与native stack,其实这个问题,我们不从JVM的角度去看,而是从操作系统层面出发来理解会更为简单直观。以Linux系统下为例,首先JVM名义上是一个虚拟机,但是其本质就是跑在操作系统上的一个进程,因此这个进程的内存会存在如下左图所示划分。而JVM的内存管理实质上是在进程的堆上进行重新划分,自己又“虚拟”出Java世界里的堆栈。如右图所示,native的栈区就是JVM进程的栈区,进程的堆区一部分用于JVM进行管理,剩余的则可以给native方法进行分配使用。



![图 3](https://img-blog.csdnimg.cn/img_convert/da340d31c7e546ff03c6f428dab2e7fc.png)



图 3



#### []( )4.2.2 调用过程



前文提到,native方法调用前,需要将其所在的动态库加载到内存中,这个过程是利用Linux的dlopen实现的,JVM会把动态库中的代码片段放到Native Code区域,同时会在JVM Bytecode区域保存一份native方法名与其所在Native Code里的内存地址映射。



一次native方法的调用步骤,大致分为四步:



1.  从JVM Bytecode获取native方法的地址。

2.  准备方法所需的参数。

3.  切换到native栈中,执行native方法。

4.  native方法出栈后,切换回JVM方法,JVM将结果拷贝至JVM的栈或堆中。



![图 4](https://img-blog.csdnimg.cn/img_convert/a8c930e93ba0d236c40ec9c013bef307.png)



图 4



由上述步骤可以看出,native方法的调用同样涉及参数的拷贝,并且其拷贝是建立在JVM堆栈和原生堆栈之间。



对于原生数据类型,参数是通过值拷贝方式与native方法地址一起入栈。而对于复杂数据类型,则需要一套协议,将Java中的object映射到C/C++中能识别的数据字节。原因是JVM与C语言中的内存排布差异较大,不能直接内存拷贝,这些差异主要包括:



### HTTP

* HTTP 报文结构是怎样的?

* HTTP有哪些请求方法?

* GET 和 POST 有什么区别?

* 如何理解 URI?

* 如何理解 HTTP 状态码?

* 简要概括一下 HTTP 的特点?HTTP 有哪些缺点?

* 对 Accept 系列字段了解多少?

* 对于定长和不定长的数据,HTTP 是怎么传输的?

* HTTP 如何处理大文件的传输?

* HTTP 中如何处理表单数据的提交?

* HTTP1.1 如何解决 HTTP 的队头阻塞问题?

* 对 Cookie 了解多少?

* 如何理解 HTTP 代理?

* 如何理解 HTTP 缓存及缓存代理?

* 为什么产生代理缓存?

* 源服务器的缓存控制

* 客户端的缓存控制

* 什么是跨域?浏览器如何拦截响应?如何解决?  



![](https://img-blog.csdnimg.cn/img_convert/3a28cc7b978db5d78ce5f1c5ec78122b.png)


**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**

**需要这份系统化的资料的朋友,可以添加V获取:vip1024c (备注前端)**
![img](https://img-blog.csdnimg.cn/img_convert/f9e2b35dfc41e6312ed3316bb0ece282.png)

**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**
cn/img_convert/a8c930e93ba0d236c40ec9c013bef307.png)



图 4



由上述步骤可以看出,native方法的调用同样涉及参数的拷贝,并且其拷贝是建立在JVM堆栈和原生堆栈之间。



对于原生数据类型,参数是通过值拷贝方式与native方法地址一起入栈。而对于复杂数据类型,则需要一套协议,将Java中的object映射到C/C++中能识别的数据字节。原因是JVM与C语言中的内存排布差异较大,不能直接内存拷贝,这些差异主要包括:



### HTTP

* HTTP 报文结构是怎样的?

* HTTP有哪些请求方法?

* GET 和 POST 有什么区别?

* 如何理解 URI?

* 如何理解 HTTP 状态码?

* 简要概括一下 HTTP 的特点?HTTP 有哪些缺点?

* 对 Accept 系列字段了解多少?

* 对于定长和不定长的数据,HTTP 是怎么传输的?

* HTTP 如何处理大文件的传输?

* HTTP 中如何处理表单数据的提交?

* HTTP1.1 如何解决 HTTP 的队头阻塞问题?

* 对 Cookie 了解多少?

* 如何理解 HTTP 代理?

* 如何理解 HTTP 缓存及缓存代理?

* 为什么产生代理缓存?

* 源服务器的缓存控制

* 客户端的缓存控制

* 什么是跨域?浏览器如何拦截响应?如何解决?  



![](https://img-blog.csdnimg.cn/img_convert/3a28cc7b978db5d78ce5f1c5ec78122b.png)


**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**

**需要这份系统化的资料的朋友,可以添加V获取:vip1024c (备注前端)**
[外链图片转存中...(img-nCYNsLAo-1713424450656)]

**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**
  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值