多核线程笔记-java内存模型详解

<div class="quote_title">galaxystar 写道</div>
<div class="quote_div"><strong><span style="font-size: small;">内存模型 (memory model)</span><br />
</strong> 内存模型描述的是程序中各变量(实例域、静态域和数组元素)之间的关系,以及在实际计算机系统中将变量存储到内存和从内存取出变量这样的低层细节.<br />
<br />
不同平台间的处理器架构将直接影响内存模型的结构.<br />
<br />
在C或C++中, 可以利用不同操作平台下的内存模型来编写并发程序. 但是, 这带给开发人员的是, 更高的学习成本.<br />
相比之下, java利用了自身虚拟机的优势, 使内存模型不束缚于具体的处理器架构, 真正实现了跨平台.<br />
(针对hotspot jvm, jrockit等不同的jvm, 内存模型也会不相同)<br />
<br />
<span style="font-weight: bold">内存模型的特征:</span><br />
a, Visibility 可视性 (多核,多线程间数据的共享)<br />
b, Ordering 有序性 (对内存进行的操作应该是有序的)<br />
<br />
<hr style="width: 100%; height: 2px" />
<strong><span style="font-size: small;"><br />
</span></strong><strong><span style="font-size: small;">java 内存模型</span></strong><strong><span style="font-size: small;"> (</span></strong><strong><span style="font-size: small;">java memory model</span></strong><strong><span style="font-size: small;">)<br />
</span> </strong>根据Java Language Specification中的说明, jvm系统中存在一个主内存(Main Memory或Java Heap Memory),Java中所有变量都储存在主存中,对于所有线程都是共享的。<br />
<br />
每条线程都有自己的工作内存(Working Memory),工作内存中保存的是主存中某些变量的拷贝,线程对所有变量的操作都是在工作内存中进行,线程之间无法相互直接访问,变量传递均需要通过主存完成。<br />
<br />
<img src="http://www.yesky.com/image20010518/109306.gif" alt="" /><br />
<br />
其中, 工作内存里的变量, 在多核处理器下, 将大部分储存于处理器高速缓存中, 高速缓存在不经过内存时, 也是不可见的.<br />
<br />
<span style="font-weight: bold"><strong>jmm怎么体现 可视性(Visibility) ?</strong><br />
</span>在jmm中, 通过并发线程修改变量值, 必须将线程变量同步回主存后, 其他线程才能访问到.<br />
<strong><br />
<span style="font-weight: bold">jmm怎么体现 有序性(Ordering) ?</span></strong> <br />
通过java提供的同步机制或volatile关键字, 来保证内存的访问顺序. <span style="font-weight: bold"><br />
</span><br />
<hr style="width: 100%; height: 2px" />
<br />
<span style="font-weight: bold"><strong><span style="font-size: small;">缓存一致性(cache coherency)</span></strong><br />
<br />
</span><strong><span style="font-weight: bold; color: #000000;"> 什么是缓存一致性?</span></strong><br />
它是一种管理多处理器系统的高速缓存区结构,其可以保证数据在高速缓存区到内存的传输中不会丢失或重复。(来自wikipedia)<br />
<br />
举例理解:<br />
假如有一个处理器有一个更新了的变量值位于其缓存中,但还没有被写入主内存,这样别的处理器就可能会看不到这个更新的值.<br />
<br />
<strong><span style="font-weight: bold; color: #000000;"> 解决缓存一致性的方法?</span></strong><br />
a, 顺序一致性模型:<br />
要求某处理器对所改变的变量值立即进行传播, 并确保该值被所有处理器接受后, 才能继续执行其他指令.<br />
<br />
b, 释放一致性模型: (类似jmm cache coherency)<br />
允许处理器将改变的变量值延迟到释放锁时才进行传播.<br />
<br />
<hr style="width: 100%; height: 2px" />
<br />
<strong><span style="font-size: small;"><span style="font-weight: bold">jmm缓存一致性模型 - "happens-before ordering(先行发生排序)"</span></span></strong><br />
<br />
一般情况下的示例程序:<br />
<br />
x = 0;<br />
y = 0;<br />
i = 0;<br />
j = 0;<br />
<br />
// thread A<br />
y = 1;<br />
x = 1;<br />
<br />
// thread B<br />
i = x;<br />
j = y;<br />
<br />
在如上程序中, 如果线程A,B在无保障情况下运行, 那么i,j各会是什么值呢?<br />
<br />
答案是, 不确定. (00,01,10,11都有可能出现)<br />
<span style="color: #ff0000;">这里没有使用java同步机制, 所以 jmm 有序性和可视性 都无法得到保障.</span><br />
<br />
<strong><span style="font-weight: bold">happens-before ordering(</span><span style="font-weight: bold; color: #ff0000;"><span style="color: #000000;">先行发生排序)</span></span><span style="font-weight: bold">如何避免这种情况?</span></strong><span style="color: #ff0000;"><br />
<span style="color: #000000;">排序原则已经做到:</span><br />
</span><span style="color: #ff0000;"><span style="color: #000000;">a, </span></span><span style="color: #ff0000;"><span style="color: #000000;">在程序顺序中, </span></span><span style="color: #ff0000;"><span style="color: #000000;">线程中的每一个操作, 发生在当前操作后面将要出现的每一个操作之前.<br />
b, 对象监视器的解锁发生在等待获取对象锁的线程之前.<br />
c, 对volitile关键字修饰的变量写入操作, 发生在对该变量的读取之前.<br />
d, </span></span>对一个线程的 Thread.start() 调用 发生在启动的线程中的所有操作之前.<br />
e, 线程中的所有操作 发生在从这个线程的 Thread.join()成功返回的所有其他线程之前.<br />
<span style="color: #ff0000;"><br />
<span style="color: #000000;">为了实现</span></span><span style="color: #ff0000;"><span style="color: #000000;">happends-before ordering原则, java及jdk提供的工具:<br />
</span> <span style="color: #000000;">a, synchronized关键字<br />
b, volatile关键字<br />
c, final变量<br />
d, java.util.concurrent.locks包(since jdk 1.5)<br />
e, java.util.concurrent.atmoic包(since jdk 1.5)<br />
...<br />
</span><br />
<span style="color: #000000;">使用了happens-before ordering的例子:</span></span><span style="color: #ff0000;"><br />
</span><br />
<br />
<img src="http://www.ibm.com/developerworks/cn/java/j-jtp03304/jsr133.gif" alt="" width="336" height="257" /> <img alt="" /><br />
<br />
(1) 获取对象监视器的锁(lock)<br />
<br />
(2) <span style="color: #ff0000;">清空工作内存数据, 从主存复制变量到当前工作内存, 即同步数据 (read and load)</span><br />
<br />
(3) 执行代码,改变共享变量值 (use and assign)<br />
<br />
(4) 将工作内存数据刷回主存 (store and write)<br />
<br />
(5) 释放对象监视器的锁 (unlock)<br />
<br />
<span style="color: #ff0000;">注意: 其中4,5两步是同时进行的.</span><br />
<br />
这边最核心的就是第二步, 他同步了主内存,即前一个线程对变量改动的结果,可以被当前线程获知!(利用了happens-before ordering原则)<br />
<br />
<strong><span style="font-weight: bold">对比之前的例子</span></strong><br />
如果多个线程同时执行一段未经锁保护的代码段,很有可能某条线程已经改动了变量的值,但是其他线程却无法看到这个改动,依然在旧的变量值上进行运算,最终导致不可预料的运算结果。<br />
<br />
<hr style="width: 100%; height: 2px" />
<strong><br />
</strong> <span style="font-size: small;"><span style="font-weight: bold"><strong>经典j2ee设计模式Double-Checked Locking失效问题</strong><br />
</span><span style="font-size: x-small;">双重检查锁定失效问题,一直是JMM无法避免的缺陷之一.了解DCL失效问题, 可以帮助我们深入JMM运行原理.<br />
<br />
要展示DCL失效问题, 首先要理解一个重要概念- 延迟加载(lazy loading).<br />
<br />
非单例的单线程延迟加载示例:<br />
</span></span><span class="f14">class Foo <br />
{<br />
private Resource res = null;<br />
public Resource getResource() <br />
{<br />
    // 普通的延迟加载<br />
if (res == null) <br />
        res = new Resource(); <br />
return res;<br />
}<br />
}<br />
<br />
</span><span style="font-size: small;"><span style="font-size: x-small;">非单例的</span></span><span class="f14">多线程延迟加载示例:<br />
</span><span class="f14">Class Foo <br />
{<br />
Private Resource res = null;<br />
Public <span style="color: #ff0000;">synchronized</span> Resource getResource()<br />
{<br />
      // 获取实例操作使用同步方式, 性能不高<br />
If (res == null) res = new Resource();<br />
return res;<br />
}<br />
}<br />
<br />
</span><span style="font-size: small;"><span style="font-size: x-small;">非单例的</span></span><span class="f14">DCL多线程延迟加载示例:<br />
</span><span class="f14">Class Foo <br />
{<br />
Private Resource res = null;<br />
Public Resource getResource() <br />
{<br />
If (res == null)<br />
{<br />
       //只有在第一次初始化时,才使用同步方式.<br />
synchronized(this)<br />
{<br />
if(res == null)<br />
{<br />
res = new Resource();<br />
}<br />
}<br />
}<br />
return res;<br />
}<br />
}<br />
<br />
</span><span class="f14">Double-Checked Locking看起来是非常完美的。但是很遗憾,根据Java的语言规范,上面的代码是不可靠的。<br />
<br />
</span><span class="f14">出现上述问题, 最重要的2个原因如下:<br />
1, 编译器优化了程序指令, 以加快cpu处理速度.<br />
2, 多核cpu动态调整指令顺序, 以加快并行运算能力.<br />
<br />
</span><span class="f14">问题出现的顺序:<br />
1, 线程A, 发现对象未实例化, 准备开始实例化<br />
2, 由于编译器优化了程序指令, 允许对象在构造函数未调用完前, 将</span><span class="f14">共享变量的引用指向</span><span class="f14">部分构造的对象, 虽然对象未完全实例化, 但已经不为null了.<br />
3, 线程B, 发现部分构造的对象已不是null, 则直接返回了该对象.<br />
<br />
</span><span class="f14">不过, 一些著名的开源框架, 包括jive,lenya等也都在使用DCL模式, 且未见一些极端异常.<br />
说明, DCL失效问题的出现率还是比较低的.<br />
接下来就是性能与稳定之间的选择了?<br />
<br />
<strong><span style="font-weight: bold">DCL的替代</span></strong></span><strong><a title="code2" name="code2"></a><strong>Initialize-On-Demand</strong></strong><span class="f14">:<br />
<br />
public class Foo {<br />
    // 似有静态内部类, 只有当有引用时, 该类才会被装载<br />
    private static class LazyFoo {<br />
       public static Foo foo = new Foo();<br />
    }<br />
<br />
    public static Foo getInstance() {<br />
       return LazyFoo.foo;<br />
    }<br />
}</span><br />
<span class="f14"><br />
维基百科的DCL解释:<br />
</span><span class="f14">http://en.wikipedia.org/wiki/Double-checked_locking<br />
<br />
DCL的完美解决方案:<br />
http://www.theserverside.com/patterns/thread.tss?thread_id=39606</span><strong><br />
<br />
<span style="color: #ff0000;"> 总结:<br />
多线程编程, 针对有写操作的变量, 必须 保证其所有引用点与主存中数据一致(考虑采用同步或volatile)</span><span style="color: #ff0000;">.<br />
<br />
</span> </strong>
<h2><strong><a href="../../show/109150"><span class="postdesc">多核线程笔记-volatile原理与技巧</span></a></strong></h2>
<strong><strong> </strong></strong></div>
<p> </p>
1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
应用背景为变电站电力巡检,基于YOLO v4算法模型对常见电力巡检目标进行检测,并充分利用Ascend310提供的DVPP等硬件支持能力来完成流媒体的传输、处理等任务,并对系统性能做出一定的优化。.zip深度学习是机器学习的一个子领域,它基于人工神经网络的研究,特别是利用多层次的神经网络来进行学习和模式识别。深度学习模型能够学习数据的高层次特征,这些特征对于图像和语音识别、自然语言处理、医学图像分析等应用至关重要。以下是深度学习的一些关键概念和组成部分: 1. **神经网络(Neural Networks)**:深度学习的基础是人工神经网络,它是由多个层组成的网络结构,包括输入层、隐藏层和输出层。每个层由多个神经元组成,神经元之间通过权重连接。 2. **前馈神经网络(Feedforward Neural Networks)**:这是最常见的神经网络类型,信息从输入层流向隐藏层,最终到达输出层。 3. **卷积神经网络(Convolutional Neural Networks, CNNs)**:这种网络特别适合处理具有网格结构的数据,如图像。它们使用卷积层来提取图像的特征。 4. **循环神经网络(Recurrent Neural Networks, RNNs)**:这种网络能够处理序列数据,如时间序列或自然语言,因为它们具有记忆功能,能够捕捉数据中的时间依赖性。 5. **长短期记忆网络(Long Short-Term Memory, LSTM)**:LSTM 是一种特殊的 RNN,它能够学习长期依赖关系,非常适合复杂的序列预测任务。 6. **生成对抗网络(Generative Adversarial Networks, GANs)**:由两个网络组成,一个生成器和一个判别器,它们相互竞争,生成器生成数据,判别器评估数据的真实性。 7. **深度学习框架**:如 TensorFlow、Keras、PyTorch 等,这些框架提供了构建、训练和部署深度学习模型的工具和库。 8. **激活函数(Activation Functions)**:如 ReLU、Sigmoid、Tanh 等,它们在神经网络中用于添加非线性,使得网络能够学习复杂的函数。 9. **损失函数(Loss Functions)**:用于评估模型的预测与真实值之间的差异,常见的损失函数包括均方误差(MSE)、交叉熵(Cross-Entropy)等。 10. **优化算法(Optimization Algorithms)**:如梯度下降(Gradient Descent)、随机梯度下降(SGD)、Adam 等,用于更新网络权重,以最小化损失函数。 11. **正则化(Regularization)**:技术如 Dropout、L1/L2 正则化等,用于防止模型过拟合。 12. **迁移学习(Transfer Learning)**:利用在一个任务上训练好的模型来提高另一个相关任务的性能。 深度学习在许多领域都取得了显著的成就,但它也面临着一些挑战,如对大量数据的依赖、模型的解释性差、计算资源消耗大等。研究人员正在不断探索新的方法来解决这些问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值