提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
https://blog.dyngr.com/blog/2016/09/15/java-forkjoinpool-internals/
前言
第三天学到了什么
java.util.concurrent
- 使用线程池 而不直接创建线程
- 使用CopyOnWriteArrayList让监听器相关的代码更加简单高效
- 使用ArrayBlockingQueue让生产者和消费者之间高效协作
- ConcurrentHashMap提供了更好的并发访问
一、ForkJoinPool
阅读ForkJoinPool的文档——fork/join框架与线程池有什么区别?分别适用于什么场景?
1.Fork/Join采用“工作窃取”模式(work-stealing)
当执行新的任务时它可以将其拆分分成更小的任务执行,并将小任务加到线程队列中,然后再从一个随机线程的队列中偷一个并把它放在自己的队列中。
- 普通线程池所有线程共享一个工作队列,有空闲线程时工作队列中的任务才能得到执行
- ForkJoinPool 中的每个线程有自己独立的工作队列,每个工作线程运行中产生新的任务,放在队尾
- 某个工作线程会尝试窃取别个工作线程队列中的任务,从队列头部窃取
- 遇到 join() 时,如前面的 future.get(),如果 join 的任务尚未完成,则可先处理其他任务
2.Fork/Join与线程池有什么区别
相对于一般的线程池实现,fork/join框架的优势体现在对其中包含的任务的处理方式上。在一般的线程池中,如果一个线程正在执行的任务由于某些原因无法继续运行,那么该线程会处于等待状态。
而在fork/join框架实现中,如果某个子问题由于等待另外一个子问题的完成而无法继续运行。那么处理该子问题的线程会主动寻找其他尚未运行的子问题来执行.这种方式减少了线程的等待时间,提高了性能。
3.分别适用于什么场景
Fork/Join 提供了一种避免任务相互等待的可能性
个人认为 Fork/Join 更适用与类似一个生产者,多个消费者这种一对多,
多个线程竞争一个资源
二、使用步骤
1.引入库
代码如下(示例):
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')
import ssl
ssl._create_default_https_context = ssl._create_unverified_context
2.读入数据
代码如下(示例):
data = pd.read_csv(
'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
print(data.head())
该处使用的url网络请求的数据。
总结
提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。