Python多线程总结在实际处理数据时,因系统内存有限,我们不可能一次把所有数据都导出进行操作,所以需要批量导出依次操作 。为了加快运行,我们会采用多线程的方法进行数据处理,以下为我总结的多线程批量处理数据的模板:
主要分为三大部分:
共分4部分对多线程的内容进行总结 。
先为大家介绍线程的相关概念:
【pathy编程和python python多线程】在飞车程序中,如果没有多线程,我们就不能一边听歌一边玩飞车,听歌与玩 游戏 不能并行;在使用多线程后,我们就可以在玩 游戏 的同时听背景音乐 。在这个例子中启动飞车程序就是一个进程,玩 游戏 和听音乐是两个线程 。
Python 提供了 threading 模块来实现多线程:
因为新建线程系统需要分配资源、终止线程系统需要回收资源,所以如果可以重用线程,则可以减去新建/终止的开销以提升性能 。同时,使用线程池的语法比自己新建线程执行线程更加简洁 。
Python 为我们提供了 ThreadPoolExecutor 来实现线程池,此线程池默认子线程守护 。它的适应场景为突发性大量请求或需要大量线程完成任务,但实际任务处理时间较短 。
其中max_workers 为线程池中的线程个数,常用的遍历方法有 map 和 submit+as_completed。根据业务场景的不同,若我们需要输出结果按遍历顺序返回,我们就用 map 方法,若想谁先完成就返回谁,我们就用 submit+as_complete 方法 。
我们把一个时间段内只允许一个线程使用的资源称为临界资源,对临界资源的访问,必须互斥的进行 。互斥,也称间接制约关系 。线程互斥指当一个线程访问某临界资源时,另一个想要访问该临界资源的线程必须等待 。当前访问临界资源的线程访问结束,释放该资源之后,另一个线程才能去访问临界资源 。锁的功能就是实现线程互斥 。
我把线程互斥比作厕所包间上大号的过程,因为包间里只有一个坑,所以只允许一个人进行大号 。当第一个人要上厕所时,会将门上上锁,这时如果第二个人也想大号,那就必须等第一个人上完,将锁解开后才能进行,在这期间第二个人就只能在门外等着 。这个过程与代码中使用锁的原理如出一辙,这里的坑就是临界资源 。Python 的 threading 模块引入了锁 。threading 模块提供了 Lock 类,它有如下方法加锁和释放锁:
我们会发现这个程序只会打印“第一道锁”,而且程序既没有终止,也没有继续运行 。这是因为Lock 锁在同一线程内第一次加锁之后还没有释放时,就进行了第二次 acquire 请求,导致无法执行 release,所以锁永远无法释放,这就是死锁 。如果我们使用 RLock 就能正常运行,不会发生死锁的状态 。
在主线程中定义Lock 锁,然后上锁,再创建一个子 线程t 运行 main 函数释放锁,结果正常输出,说明主线程上的锁,可由子线程解锁 。
如果把上面的锁改为RLock 则报错 。在实际中设计程序时,我们会将每个功能分别封装成一个函数,每个函数中都可能会有临界区域,所以就需要用到 RLock。
一句话总结就是Lock 不能套娃,RLock 可以套娃; Lock 可以由其他线程中的锁进行操作,RLock 只能由本线程进行操作 。
文章插图
Python多线程是什么意思?多线程能让你像运行一个独立的程序一样运行一段长代码 。这有点像调用子进程(subprocess),不过区别是你调用shu的是一个函数或者一个类,而不是独立的程序 。
程基本上是一个独立执行流程 。单个进程可以由多个线程组成 。程序中的每个线程都执行特定的任务 。例如,当你在电脑上玩游戏时,比如说国际足联,整个游戏是一个单一的过程 。,但它由几个线程组成,负责播放音乐、接收用户的输入、同步运行对手等 。所有这些都是单独的线程,负责在同一个程序中执行这些不同的任务 。
每个进程都有一个始终在运行的线程 。这是主线 。这个主线程实际上创建子线程对象 。子线程也由主线程启动 。
python之多线程 进程的概念:以一个整体的形式暴露给操作系统管理,里面包含各种资源的调用 。对各种资源管理的集合就可以称为进程 。
线程的概念:是操作系统能够进行运算调度的最小单位 。本质上就是一串指令的集合 。
进程和线程的区别:
1、线程共享内存空间,进程有独立的内存空间 。
2、线程启动速度快,进程启动速度慢 。注意:二者的运行速度是无法比较的 。
秒懂生活扩展阅读
- 老火汤和炖汤的区别
- 夏令时什么时候开始和结束
- 会计和出纳哪个地位高
- 重阳节来历和节日风俗
- wiiu和3ds哪个好
- 前鼻韵母和后鼻韵母翘舌音 前鼻韵母和后鼻韵母
- 扯面的面怎么样和才有劲道
- 乒乓球有缝和无缝有什么区别
- 烤红薯和米饭哪个热量高 烤红薯怎么吃不会胖
- 农民公寓和商品房区别