若想技术精进,当然得把基础知识打得牢牢的。
廖雪峰的官方网站 python3教程,该网站提供的教程浅显易懂,还附带了讲学视频,非常适合初学者正规入门。
以下是通过廖雪峰python官方网站学习的个人查漏补缺。
主要内容包括:1.IO编程 【 1)输入/输出流 2)异步编程VS同步编程 3)文件读写 4)StringIO和BytesIO 5)操作文件和目录 6)序列化pickle和json 】 2.进程和线程 【 1)多进程multiprocessing 2)多线程 3)ThreadLocal线程局部变量 4)进程VS线程 5)分布式进程 】 3.正则表达式 【 此处思路清晰、简单易懂 (re模块、切分、分组、编译) 】
1.IO编程
1)输入/ 输出流
IO( Input/Output ),也就是输入和输出。IO编程中,Stream(流)是一个很重要的概念,可以把流想象成一个水管,数据就是水管里的水,但是只能单向流动。Input Stream就是数据从外面(磁盘、网络)流进内存,Output Stream就是数据从内存流到外面去。对于浏览网页来说,浏览器和新浪服务器之间至少需要建立两根水管,才可以既能发数据,又能收数据。
2)异步编程 VS 同步编程
由于CPU和内存的速度远远高于外设的速度,所以,在IO编程中,就存在速度严重不匹配的问题。同步和异步的区别就在于是否等待IO执行的结果。
好比你去麦当劳点餐,你说“来个汉堡”,服务员告诉你,对不起,汉堡要现做,需要等5分钟,于是你站在收银台前面等了5分钟,拿到汉堡再去逛商场,这是同步IO。
你说“来个汉堡”,服务员告诉你,汉堡需要等5分钟,你可以先去逛商场,等做好了,我们再通知你,这样你可以立刻去干别的事情(逛商场),这是异步IO。
3)文件读写
读文件:使用Python内置的open()函数,传入文件名和标示符:>>> f = open('/Users/michael/test.txt', 'r')
>>> f = open('路径及文件名', '文件操作标示符‘)
Python引入了with语句来自动帮我们调用close()方法:
注:::调用read()会一次性读取文件的全部内容,如果文件有10G,内存就爆了,所以,要保险起见,可以反复调用read(size)方法,每次最多读取size个字节的内容。另外,调用readline()可以每次读取一行内容,调用readlines()一次读取所有内容并按行返回list。因此,要根据需要决定怎么调用。
小技巧:如果文件很小,read()一次性读取最方便;如果不能确定文件大小,反复调用read(size)比较保险;如果是配置文件,调用readlines()最方便。
读二进制文件:要读取二进制文件,比如图片、视频等等,用'rb'模式打开文件即可:>>> f = open('/Users/michael/test.jpg', 'rb')
>>> f.read()
字符编码:需要给open()函数传入encoding参数,遇到有些编码不规范的文件,你可能会遇到UnicodeDecodeError,因为在文本文件中可能夹杂了一些非法编码的字符。遇到这种情况,open()函数还接收一个errors参数( 遇到字符编码错误,可忽略 ),表示如果遇到编码错误后如何处理。最简单的方式是直接忽略:>>> f = open('/Users/michael/gbk.txt', 'r', encoding='gbk', errors='ignore')
写文件:同样使用Python内置的open()函数,传入文件名和标示符,传入标识符'w'或者'wb'表示写文本文件或写二进制文件,传入'a'以追加(append)模式写入。
在Python中,文件读写是通过open()函数打开的文件对象完成的。使用with语句操作文件IO是个好习惯。
4)StringIO和BytesIO
StringIO:数据读写不一定是文件,也可以在内存中读写。StringIO顾名思义就是在内存中读写str。
BytesIO:StringIO操作的只能是str,如果要操作二进制数据,就需要使用BytesIO。
StringIO和BytesIO是在内存中操作str和bytes的方法,使得和读写文件具有一致的接口。
5)操作文件和目录
对于文件和目录操作,Python内置的os模块可以解决。Python内置的os模块可以直接调用操作系统的接口函数。
windows电脑
liunx服务器
如果是posix,说明系统是Linux、Unix或Mac OS X,如果是nt,就是Windows系统。