这取决于你所说的“原始”是什么意思
爪哇的“原始”通常指的是“价值型”。但是,C有一个
string
关键字,它与Java的字符串完全相同,编辑器只是突出显示了不同的关键字。它们是类的别名
System.String
或
java.lang.String
. 字符串在任何一种语言中都不是值类型,因此这样它就不是基元。
如果您所说的“原语”是指嵌入到语言中,那么字符串就是原语。它只是用大写字母。字符串文本(引号中的内容)自动转换为
系统字符串
和+用于连接。因此,根据这个标记,它们(和数组)和ints、long等一样是原始的。
首先,什么是弦?
字符串不是包装。字符串是
引用类型
,而基元类型是
价值类型
. 意思是如果你有:
int x = 5;
int y = x;
x和y的内存都包含“5”。但与:
String x = "a";
String y = x;
x和y的内存都包含
指针
字符“A”(以及长度、偏移量、ClassInfo指针和监视器)。字符串的行为类似于原语,因为它们是不可变的,所以通常不是问题,但是,如果您使用反射来更改字符串的内容(
不要这样!
,X和Y都会看到变化。事实上,如果你有:
char[] x = "a".toCharArray();
char[] y = x;
x[0] = 'b';
System.out.println(y[0] == 'b'); // prints "true"
所以不要只使用char[](除非这是你想要的行为,或者你是
真正地
试图减少内存使用)。
每
Object
是一个引用类型——这意味着您编写的所有类、框架中的每个类,甚至数组。唯一的值类型是简单的数字类型(int、long、short、byte、float、double、char、bool等)。
为什么字符串不能像char[]那样可变?
这有两个原因,但主要归结于心理学和实施细节:
想象一下,如果你把一个字符串传递给另一个函数,而这个函数以某种方式改变了它,你会有多混乱。或者如果它把它保存在某个地方并在将来改变它呢?对于大多数引用类型,您将此视为类型的一部分,但Java开发人员决定,至少对于字符串而言,他们不希望用户不得不担心这一点。
字符串不能原子地处理,这意味着多线程/同步将成为一个问题。
字符串文本(您在代码中用引号括起来的内容)在计算机级别可能是不可变的。
一
(出于安全原因)。当程序启动或使用copy-on-write时,可以将它们全部复制到内存的另一部分,但这是
缓慢的
.
为什么我们没有字符串的值类型版本?
基本上,性能和实现细节,以及拥有两种不同字符串类型的复杂性。其他值类型具有固定的内存占用。int总是32位,long总是64位,bool总是1位,等等。
二
除其他外,这意味着它们可以存储在堆栈上,以便函数的所有参数都位于一个位置。此外,在各处复制大量字符串也会扼杀性能。
1——在C/C++和其他本地编译的语言中,这是正确的,因为它们被放置在进程的代码段中,操作系统通常会阻止您进行编辑。在爪哇,这实际上是
通常
不真实,因为JVM将类文件加载到堆中,所以可以在堆中编辑字符串。然而,没有理由Java程序不能自行编译(有工具做到这一点)和一些架构(特别是ARM的一些版本)。
做
直接执行Java字节码。
2-在实践中,这些类型中的一些在机器级别是不同的大小。E.X.bools在堆栈上存储为字大小(x86上为32位,x64上为64位)。在类/数组中,它们的处理方式可能不同。这是留给JVM的所有实现细节——规范说布尔值要么是对的要么是错的,机器可以知道如何实现它。