python 基础部分重点复习整理--从意识那天开始进阶--已结

pythonic 风格编码

636379-20180614180137257-529947281.png

入门python好博客
进阶大纲
有趣的灵魂
老齐的教程
老齐还整理了很多精华
听说 fluent python + pro python 这两本书还不错!

元组三种遍历,有点像字有四种写法一样。。。苦笑

for index in range(0,len(tuple_1)):
...     print(tuple_1[index])

>>> for index in range(0,len(tuple_1)):
...     print('{}--{}'.format(index,tuple_1[index]))


>>> tuple_1 = (1,2,'hello','world')
>>> for content in tuple_1:
...     print(content)

>>> for index,enum in enumerate(tuple_1):
...     print('{}--{}'.format(index,enum))

# 黑魔法咩?  map ,reduce
from functools import reduce
def str2int(s):
    Digital = {'0':0,'1':1,'2':2,'3':3,'4':4,'5':5,'6':6,'7':7,'8':8,'9':9}
    return Digital[s]

def str_reduce(s):
    l = list(map(str2int,s))
    if not isinstance(s, str):
        raise ValueError('输入不是字符串类型!')
    return reduce(lambda x,y:x+y,[v * 10**(len(l)-i-1) for  i , v in enumerate(l)])

str_reduce('213')

# 更加 逆天的 map 用法,不论传入的 list 是普通值 还是 func 都行

>>> for i in range(10):
...     print(list(map(lambda x:x(i),[lambda x:x+x,lambda x:x**2])))


# filter 用法
>>> list_1 = [i for i in range(30) if i%2 == 1]
>>> list_1
[1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29]
>>> list(filter(lambda x:x<10,list_1))
[1, 3, 5, 7, 9]

tuple 互转   tuple(list_1)    ,  list(tuple_2)
>>> import os
>>> print(os.path.abspath('.'))
C:\Users\FrankLi\Desktop
>>> import sys
>>> print(sys.argv)
['']
>>> print(sys.executable)
D:\Program Files (x86)\python\python.exe
  • 列表生成式 vs 生成器表达式
>>> [x for x in list_1 if x%2==1]
[1, 3, 5]

>>> (x for x in list_1 if x%2==1)
<generator object <genexpr> at 0x033C2660>

>>> gen = (x for x in range(0,10) if x%3==1)
>>> for x in gen:
...     print(x)
...
1
4
7


>>> #这是一个生成器应用,斐波拉契数列
... def fib(max):
...     n,a,b=0,1,1
...     while n<=max:
...         yield b
...         a,b=b,a+b
...         n=n+1
...     return 'Nore More!'
...
>>> for f in fib(6):
...     print('fib: {}'.format(f))
...
fib: 1
fib: 2
fib: 3
fib: 5
fib: 8
fib: 13
fib: 21

>>> def fib(x):
...     a,b = 1,1
...     for i in range(x):
...         yield a
...         a,b = b,a+b
...
>>> for i in fib(10):
...     print(i)
...
1
1
2
3
5
8
13
21
34
55

#获取生成器重的 return 返回值 Nore More!

>>> g = fib(6)
>>> while True:
...    try:
...        x=next(g)
...        print('g: {}'.format(x))
...    except StopIteration as e:
...        print('evalue: {}'.format(e.value))
...        break
...
g: 1
g: 2
g: 3
g: 5
g: 8
g: 13
g: 21
evalue: Nore More!

# string 也是序列可以被迭代 iter(s) 即可
>>> s = 'google'
>>> s_iter = iter(s)
>>> while True:
...     try:
...         print(next(s_iter))
...     except StopIteration as stopIter:
...         print('done')
...         break
...
g
o
o
g
l
e
done


>>> # 杨辉三角末尾补零两数相加大法
... def triangle():
...     l=[1]
...     while True:
...         yield l
...         l.append(0)
...         l=[l[i-1]+l[i] for i in range(0,len(l))]


调用杨辉三角生成器
>>> n=0
>>> for e in triangle():
...     n=n+1
...     print(e,'\t')
...     if n==10:
...         break
...
[1]
[1, 1]
[1, 2, 1]
[1, 3, 3, 1]
[1, 4, 6, 4, 1]
[1, 5, 10, 10, 5, 1]
[1, 6, 15, 20, 15, 6, 1]
[1, 7, 21, 35, 35, 21, 7, 1]
[1, 8, 28, 56, 70, 56, 28, 8, 1]
[1, 9, 36, 84, 126, 126, 84, 36, 9, 1]

迭代器

Generator 天然的 迭代器 
而  tuple , list 等 序列如果要编程 迭代器 需要 iter(list_1) 、iter(tuple_2)
>>> from collections import Iterator
>>> isinstance((1,2,3,4),Iterator)
False
>>> isinstance((x for x in range(10) if x%2==0),Iterator)
True
>>>
>>> isinstance(iter((1,2,3,4)),Iterator)
True
>>>

>>> list_1 = [1,2,3,4]
>>> list_1_iter = iter(list_1)
>>> while True:
...     try:
...         x=next(list_1_iter)
...         print('x:{}'.format(x))
...     except StopIteration as e:
...         print('e.value: {}'.format(e.value))
...         break
...
x:1
x:2
x:3
x:4
e.value: None
  • python map reduce 实现
>>> def pow2(val):
...     return val**2
...
>>> list_1 = [1,2,3,4,5]
>>> list(map(pow2,list_1))
[1, 4, 9, 16, 25]
>>> def sum(x,y):
...     return x+y
...
>>> from functools import reduce
>>> reduce(sum,list(map(pow2,list_1)))
55

强悍的 lambda

>>> from functools import reduce
>>> reduce(lambda x,y:x+y,list(map(lambda x:x**2,[1,2,3,4,5,6,7])))
  • 注意区别 Iterable 可迭代 与 Iterator 惰性迭代器

高阶函数

>>> def lazy_sum(*args):
...     def sum():
...         ax=0
...         for n in args:
...          ax=ax+n
...         return ax
...     return sum
...
>>> lazy_sum(1,2,3,4,5)
<function lazy_sum.<locals>.sum at 0x013902B8>
>>> f=lazy_sum(1,2,3,4,5)
>>> f()
15

win 下 python 清屏

>>> import os
>>> def clear():
...     os.system('cls')


>>> import os
>>> def cls():
...     if os.name.upper() == 'NT':
...         os.system('cls')
...     else:
...         os.system('clear')

可变参数,巧调用

python的可变参数和关键字参数(*args **kw)

讲*args 可变参数, **kw 关键字参数非常好的文章

>>> def test(*args):
...     sum=0
...     for n in args:
...         sum=sum+n
...     return sum
... test([1,2,3,4])
  File "<stdin>", line 6
    test([1,2,3,4])
       ^
SyntaxError: invalid syntax
>>> test(*[1,2,3,4])
10
>>> test(1,2,3,4)
10


在 python3 中已经废除了 dict 的 has_key 方法 用  key in dict 这种方式代替

>>> def person(*args,**kw):
...     l=[]
...     for n in args:
...         l.append(n)
...     dic=kw
...     if 'city' in dic:
...         pass
...     if 'job' in dic:
...         pass
...     print('l:{} dic {}'.format(l,dic))
...
>>> person('tom',2,city='changsha',job='unknown')
l:['tom', 2] dic {'city': 'changsha', 'job': 'unknown'}

进阶
>>> extra = {'city':'cs','job':'developer'}
>>> tuple=('tom',30)
>>> person(*tuple,**extra)
l:['tom', 30] dic {'city': 'cs', 'job': 'developer'}
>>>

装饰器类似于 java 里的 AOP 动态代理,或者继承组合

>>> import functools
>>> #自定义文本消息的事务装饰器
... def trans(text):
...     def decorater(func):
...         @functools.wraps(func)
...         def wrapper(*args,**kw):
...             print('{} {}'.format(text,func.__name__))
...             return func(*args,**kw)
...         return wrapper
...     return decorater
...
>>> @trans('开启事务'):
  File "<stdin>", line 1
    @trans('开启事务'):
                  ^
SyntaxError: invalid syntax
>>> @trans('开启事务')
... def trans_func():
...     print('我是一个要被事务装饰的函数')
...
>>> trans_func()
开启事务 trans_func
我是一个要被事务装饰的函数

>>> from functools import wraps
>>> def my_decorator(func):
...     @wraps(func)
...     def wrap_func():
...         print('before...')
...         func()
...         print('after...')
...     return wrap_func
...
>>> @my_decorator
... def func_a():
...     print('func_a...')
...
>>> func_a()
before...
func_a...
after...
>>> func_a.__name__
'func_a'


>>> from functools import wraps
>>> def custom_text(text):
...     def decorater(func):
...         @wraps(func)
...         def wrap_decorated(*args,**kwargs):
...             print('{} {}'.format(text,func.__name__))
...             return func(*args,**kwargs)
...         return wrap_decorated
...     return decorater
...
>>> @custom_text('自定义文本信息...')
... def tran(*args,**kwargs):
...     for i in args:
...         print(i,end=',')
...     for key,value in kwargs.items():
...         print('{}-->{}'.format(key,value))
...     print('事务...社会...')
...
>>> args = (1,'abc',3)
>>> from functools import wraps
>>> kwargs = dict(name='Frank',age=18)
>>> tran(*args,**kwargs)
自定义文本信息... tran
1,abc,3,name-->Frank
age-->18
事务...社会...


from functools import wraps

class LogIt(object):
    def __init__(self,log_file='out.log'):
        self._log_file = log_file
        
    @property
    def log_file(self):
        return self._log_file
    @log_file.setter
    def log_file(self,log_file):
        self._log_file = log_file
    def __call__(self,func):
        @wraps(func)
        def wrap_func(*args,**kwargs):
            log_string = '{} {}'.format(func.__name__,'called...')
            print('wrap_func logging...{}'+log_string)
            with open(self.log_file,'a') as logfile:
                logfile.write(log_string+'\n')
            self.notify(log_string)
            return func(*args,**kwargs)
        return wrap_func
    def notify(self,log_string):
        print('notify logging...{}'.format(log_string))

@LogIt('out1.log')
def trans(*args,**kwargs):
    for i in args:
        print(i,end=',')
    for key,value in kwargs.items():
        pritn('{}<-->{}'.format(key,value))
        
args = ('trans start..',1,2,'test')
kwargs = dict(name='Frank',age=18)
trans(*args,*kwargs)

wrap_func logging...{}trans called...
notify logging...trans called...
trans start..,1,2,test,name,age,

偏函数,可以见 functools 多么强大值得好好学学

>>> convert_int_from_8 = functools.partial(int,base=8)
>>> convert_int_from_8(12345)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: int() can't convert non-string with explicit base
>>> convert_int_from_8('12345')
5349

# kw 这种 dict 传值也是可以的
>>> kw = {'base':8}
>>> convert_int_from_8 = functools.partial(int,base)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'base' is not defined
>>> convert_int_from_8 = functools.partial(int,**kw)
>>> convert_int_from_8('123456')

最后,创建偏函数时,实际上可以接收函数对象、*args和**kw这3个参数,当传入:

int2 = functools.partial(int, base=2)
实际上固定了int()函数的关键字参数base,也就是:

int2('10010')
相当于:

kw = { 'base': 2 }
int('10010', **kw)
当传入:

max2 = functools.partial(max, 10)
实际上会把10作为*args的一部分自动加到左边,也就是:

max2(5, 6, 7)
相当于:

args = (10, 5, 6, 7)
max(*args)
结果为10。

# 总结 就是 偏函数 其实就是把原本参数很多的函数简化参数,便于使用
#当函数的参数个数太多,需要简化时,使用functools.partial可以创建一个新的函数,这个新函数可以固定住原函数的部分参数,从而在调用时更简单

模块

# -*- coding: utf-8 -*-
'test module'
__author__ = 'Frank Li'
import sys
def test():
    args=sys.argv
    if len(args)==1:
        print('hello world!')
    elif len(args)==2:
        print('hello {}'.format(args[1]))
    else:
        print('to many args!')

if __name__ == '__main__':
    test()

模块搜索路径

默认情况下,Python解释器会搜索当前目录、所有已安装的内置模块和第三方模块,搜索路径存放在sys模块的path变量中:

>>> import sys
>>> sys.path
['', '/Library/Frameworks/Python.framework/Versions/3.6/lib/python36.zip', '/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6', ..., '/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages']
如果我们要添加自己的搜索目录,有两种方法:

一是直接修改sys.path,添加要搜索的目录:

>>> import sys
>>> sys.path.append('/Users/michael/my_py_scripts')
这种方法是在运行时修改,运行结束后失效。

第二种方法是设置环境变量PYTHONPATH,该环境变量的内容会被自动添加到模块搜索路径中。设置方式与设置Path环境变量类似。注意只需要添加你自己的搜索路径,Python自己本身的搜索路径不受影响。

面向对象

>>> class Test(object):
...     def __init__(self,*args):
...         self.name,self.age=args[0],args[1]
...
>>> t = Test('frank',18)
>>> t
<__main__.Test object at 0x02F00AB0>
>>> t.name
'frank'
>>> t.age
18

再进一阶

>>> class Person(object):
...     def __init__(self,name,age,*args,**kw):
...         self.name,self.age = name,age
...         for arg in args:
...             print('arg: {}'.format(arg))
...         for key in kw:
...             print('key: {}--> value: {}'.format(key,kw[key]))
...
>>> args=('a',1,2,'b')
>>> kw ={'city':'changsha','job':'developer'}
>>> Person('frank',18,*args,**kw)
arg: a
arg: 1
arg: 2
arg: b
key: city--> value: changsha
key: job--> value: developer
<__main__.Person object at 0x02F00DD0>



>>> class Student(object):
...     def __init__(self,name,score,*args,**kw):
...         self.name,self.score = name,score
...         for arg in args:
...             print('arg: {}'.format(arg))
...         for key in kw:
...             if key=='city':
...                 self.city =kw[key]
...             elif key=='job':
...                 self.job=kw[key]
...             else:
...                 pring('key: {} --> value: {}'.format(key,kw[key]))
...     def get_grade(self):
...             if  self.score >= 90:
...                 return '优'
...             if 70<self.score<90:
...                 return '良'
...             elif 60<self.score<=70:
...                 return '几个'
...             else:
...                 return '不及格'

>>> student = Student('frank',80,*args,**kw)
arg: a
arg: 1
arg: 2
arg: 3
arg: c
arg: d
>>> student.city
'changsha'
>>> student.get_grade()
'良'
>>>

区别于 java 这种静态语言 , python 是动态语言
小结
类是创建实例的模板,而实例则是一个一个具体的对象,各个实例拥有的数据都互相独立,互不影响;

方法就是与实例绑定的函数,和普通函数不同,方法可以直接访问实例的数据;

通过在实例上调用方法,我们就直接操作了对象内部的数据,但无需知道方法内部的实现细节。

和静态语言不同,Python允许对实例变量绑定任何数据,也就是说,对于两个实例变量,虽然它们都是同一个类的不同实例,但拥有的变量名称都可能不同:

>>> bart = Student('Bart Simpson', 59)
>>> lisa = Student('Lisa Simpson', 87)
>>> bart.age = 8
>>> bart.age
8
>>> lisa.age
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: 'Student' object has no attribute 'age'

访问权限控制

此方法不推荐, 应该用 set_gender() 而不是 bart._Student__gender 这种方式修改 gender 属性
>>> class Student(object):
...     def __init__(self,name,gender):
...         self.name=name
...         self.__gender=gender
...     def get_gender(self):
...         return self.__gender
...
>>> bart = Student('Bart', 'male')
>>> if bart.get_gender() != 'male':
...     print('测试失败!')
... else:
...     bart._Student__gender='female'
...     if bart.get_gender() != 'female':
...         print('测试失败!')
...     else:
...         print('测试成功!')
...
测试成功!


正确做法:

>>> class Student(object):
...     def __init__(self,name,gender):
...         self.name,self.__gender=name,gender
...     def set_gender(self,gender):
...         self.__gender = gender
...     def get_gender(self):
...         return self.__gender

# 测试

>>> bart = Student('Bart','male')
>>> if bart.get_gender() != 'male':
...     print('测试失败~!')
... else:
...     bart.set_gender('female')
...     if bart.get_gender() != 'female':
...         print('测试失败!')
...     else:
...         print('测试成功~!')
...
测试成功~!

以为是多态,然而是多态,更不止是多态, 只要有 run 方法的 对象 都可以 往里丢 ,这一点注意区分 java 的 接口以及父类

>>> class Animal(object):
...     def run(self):
...         print('animal is running...')
...
>>> class Dog(Animal):
...     def run(self):
...         print('dog is running...')
...
>>> def run_twice(animal):
...     animal.run()
...     animal.run()
...
>>> run_twice(Animal())
animal is running...
animal is running...
>>> run_twice(Dog())
dog is running...
dog is running...

# 逝者如斯,东流不回 ,水不继承自 Animal 类 依旧可以 往 run_twice 这个方法里丢, 在 java 里是编译错误!!!
>>> class water(object):
...     def run(self):
...         print('water is running....and never back...')
...
>>> run_twice(water())
water is running....and never back...
water is running....and never back...

类型判断 type vs isinstance ==》 isinstance 胜 !!! 总是优先使用 isinstance 判断

>>> type(123) == int
True
>>> isinstance(123,int)
True

下面这种判断太过于复杂
判断基本数据类型可以直接写int,str等,但如果要判断一个对象是否是函数怎么办?可以使用types模块中定义的常量:

>>> import types
>>> def fn():
...     pass
...
>>> type(fn)==types.FunctionType
True
>>> type(abs)==types.BuiltinFunctionType
True
>>> type(lambda x: x)==types.LambdaType
True
>>> type((x for x in range(10)))==types.GeneratorType
True

并且还可以判断一个变量是否是某些类型中的一种,比如下面的代码就可以判断是否是list或者tuple:

>>> isinstance([1, 2, 3], (list, tuple))
True
>>> isinstance((1, 2, 3), (list, tuple))
True
总是优先使用isinstance()判断类型,可以将指定类型及其子类“一网打尽”。


# dir 查看,然后等价
>>> len('ABC')                                                                                                          3                                                                                                                       >>> dir('ABC')                                                                                                          ['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill'] 

# 创建自己的 len 方法, 自己写一个 __len__()  方法就是了
>>> class myStr():
...     def __init__(self,val):
...         self.__val = val
...     def __len__(self):
...         return len(self.__val)
...
>>> myStr('abc')
<__main__.myStr object at 0x02F363D0>
>>> len(myStr('abc'))
3
>>>

# 查看 python 内建函数

>>> dir(__builtins__)
['ArithmeticError', 'AssertionError', 'AttributeError', 'BaseException', 'BlockingIOError', 'BrokenPipeError', 'BufferError', 'BytesWarning', 'ChildProcessError', 'ConnectionAbortedError', 'ConnectionError', 'ConnectionRefusedError', 'ConnectionResetError', 'DeprecationWarning', 'EOFError', 'Ellipsis', 'EnvironmentError', 'Exception', 'False', 'FileExistsError', 'FileNotFoundError', 'FloatingPointError', 'FutureWarning', 'GeneratorExit', 'IOError', 'ImportError', 'ImportWarning', 'IndentationError', 'IndexError', 'InterruptedError', 'IsADirectoryError', 'KeyError', 'KeyboardInterrupt', 'LookupError', 'MemoryError', 'ModuleNotFoundError', 'NameError', 'None', 'NotADirectoryError', 'NotImplemented', 'NotImplementedError', 'OSError', 'OverflowError', 'PendingDeprecationWarning', 'PermissionError', 'ProcessLookupError', 'RecursionError', 'ReferenceError', 'ResourceWarning', 'RuntimeError', 'RuntimeWarning', 'StopAsyncIteration', 'StopIteration', 'SyntaxError', 'SyntaxWarning', 'SystemError', 'SystemExit', 'TabError', 'TimeoutError', 'True', 'TypeError', 'UnboundLocalError', 'UnicodeDecodeError', 'UnicodeEncodeError', 'UnicodeError', 'UnicodeTranslateError', 'UnicodeWarning', 'UserWarning', 'ValueError', 'Warning', 'WindowsError', 'ZeroDivisionError', '_', '__build_class__', '__debug__', '__doc__', '__import__', '__loader__', '__name__', '__package__', '__spec__', 'abs', 'all', 'any', 'ascii', 'bin', 'bool', 'bytearray', 'bytes', 'callable', 'chr', 'classmethod', 'compile', 'complex', 'copyright', 'credits', 'delattr', 'dict', 'dir', 'divmod', 'enumerate', 'eval', 'exec', 'exit', 'filter', 'float', 'format', 'frozenset', 'getattr', 'globals', 'hasattr', 'hash', 'help', 'hex', 'id', 'input', 'int', 'isinstance', 'issubclass', 'iter', 'len', 'license', 'list', 'locals', 'map', 'max', 'memoryview', 'min', 'next', 'object', 'oct', 'open', 'ord', 'pow', 'print', 'property', 'quit', 'range', 'repr', 'reversed', 'round', 'set', 'setattr', 'slice', 'sorted', 'staticmethod', 'str', 'sum', 'super', 'tuple', 'type', 'vars', 'zip']

# 查看一波
>>> 'hasattr' in dir(__builtins__)
True
>>> 'getattr' in dir(__builtins__)
True
>>>

小结
通过内置的一系列函数,我们可以对任意一个Python对象进行剖析,拿到其内部的数据。要注意的是,只有在不知道对象信息的时候,我们才会去获取对象信息。如果可以直接写:

sum = obj.x + obj.y
就不要写:

sum = getattr(obj, 'x') + getattr(obj, 'y')
一个正确的用法的例子如下:

def readImage(fp):
    if hasattr(fp, 'read'):
        return readData(fp)
    return None
假设我们希望从文件流fp中读取图像,我们首先要判断该fp对象是否存在read方法,如果存在,则该对象是一个流,如果不存在,则无法读取。hasattr()就派上了用场。

请注意,在Python这类动态语言中,根据鸭子类型,有read()方法,不代表该fp对象就是一个文件流,它也可能是网络流,也可能是内存中的一个字节流,但只要read()方法返回的是有效的图像数据,就不影响读取图像的功能。

getter setter

>>> class Student(object):
...     def __init__(self,name,*args,**kw):
...         self.__name = name
...         for arg in args:
...               print('arg: {}'.format(arg))
...         for key in kw:
...               if key == 'city':
...                   print('city %s' %kw[key])
...     @property
...     def score(self):
...         return  self._score
...     @score.setter
...     def score(self,value):
...         self._score = value
...
>>> s = Student()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: __init__() missing 1 required positional argument: 'name'
>>> s = Student('frank',*(1,2,'a',3),**{'city':'changsha','job':'unknown'})
arg: 1
arg: 2
arg: a
arg: 3
city changsha
>>> s.score = 80
>>> s.score
80


>>> class Screen(object):
...     @property
...     def width(self):
...         return self._width
...     @width.setter
...     def width(self,width):
...          self._width = width
...     @property
...     def height(self):
...          return self._height
...     @height.setter
...     def height(self,height):
...          self._height = height
...     @property
...     def resolution(self):
...          self._resolution = self._width * self._height
...          return self._resolution
...
>>> s = Screen()
>>> s.width = 600
>>> s.height = 800
>>> s.resolution
480000

记住标准写法就好,别追问,会晕!!!

>>> class Student(object):
...      def __init__(self,name,score,*args,**kw):
...           self._name = name
...           self._score = score
...           if len(args)!=0:
...               self.arg = args[0]
...           for key in kw:
...               if key == 'city':
...                   self.city = kw[key]
...      @property
...      def name(self):
...          return self._name
...      @name.setter
...      def name(self,name):
...          self._name = name
...      @property
...      def score(self):
...           return self._score
...      @score.setter
...      def score(self,score):
...           self._score = score
...
>>> args=('a',1,2)
>>> kw = {'city':'changsha','job':'unknown'}
>>> s = Student('frank',100,*args,**kw)
>>> s.name
'frank'
>>> s.score
100
>>> s.city
'changsha'
>>> s.arg
'a'




>>> class Student(object):
...     def __init__(self,name,age,score,*args,**kw):
...         self._name=name
...         self._age = age
...         self._score = score
...         if len(args)!=0:
...             self.arg = args[0]
...         for key in kw:
...             if key == 'city':
...                 self.city = kw[key]
...     @property
...     def name(self):
...         return self._name
...     @name.setter
...     def name(self,name):
...         self._name = name
...     @property
...     def age(self):
...         return self._age
...     @age.setter
...     def age(self,age):
...         if not isinstance(age,int):
...             raise TypeError('年龄必须为整数!')
...         else:
...             self._age = age
...     @property
...     def score(self):
...         return self._score
...     @score.setter
...     def score(self,score):
...         if not isinstance(score,int):
...             raise TypeError('分数应该为整数!')
...         elif not  0<= score <= 100:
...             raise ValueError('分数必须介于0-100之间!')
...         else:
...             self._score = score
...
>>> s = Student('frank',18,100)
>>> s.name
'frank'
>>> s.age
18
>>> s.score
100

多继承 ,对应 java extends class implements Runnable 这种写法, 只是 python 木有 接口一说 貌似,我也不确定哈,自己去查查吧

>>> class Animal():
...     pass
...
>>> Animal()
<__main__.Animal object at 0x008DCF30>
>>> class Mammal(Animal):
...     pass
...
>>> class Runnable(object):
...     def run(self):
...          print('running......')
...
>>> class Flyable(object):
...     def fly(self):
...         print('flying......')
...
>>> class Dog(Mammal,Runnable):
...     pass
...
>>> d = Dog()
>>> d.run()
running......
>>> class Bat(Mammal,Flyable):
...     pass
...
...
>>> b = Bat()
>>> b.fly()
flying......

定制类

# __slot__  固定 self  属性个数
# __str__   区别 于  __repr__   前一个 是 返回给 用户的 , 第二个 是 返回给 程序员 用来调试的 
>>> class Student(object):
...      def __init__(self,name):
...           self.name = name
...      def __str__(self):
...           return 'Student object (name = {})'.format(self.name)
...      __repr__ = __str__
...
>>> s = Student('frank')
>>> s
Student object (name = frank)

枚举类

>>> from enum import Enum
>>> Month = Enum('Month',('Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec'))
>>> for name,member in Month.__members__.items():
...     print(name, '=>', member, ',', member.value)
...
Jan => Month.Jan , 1
Feb => Month.Feb , 2
Mar => Month.Mar , 3
Apr => Month.Apr , 4
May => Month.May , 5
Jun => Month.Jun , 6
Jul => Month.Jul , 7
Aug => Month.Aug , 8
Sep => Month.Sep , 9
Oct => Month.Oct , 10
Nov => Month.Nov , 11
Dec => Month.Dec , 12
>>> from enum import Enum,unique
>>> @unique
... class Weekday(Enum):
...     Sun=0
...     Mon=1
...     Tue=2
...     Wed=3
...     Thu=4
...     Fri=5
...     Sat =6
...
>>> day1 = Weekday.Sun
>>> day1
<Weekday.Sun: 0>
>>> day1.value
0
>>> day1 = Weekday(0)
>>> day1
<Weekday.Sun: 0>
>>> day1.value
0

>>> for name,member in Weekday.__members__.items():
...     print(name,'==>',member)
...
Sun ==> Weekday.Sun
Mon ==> Weekday.Mon
Tue ==> Weekday.Tue
Wed ==> Weekday.Wed
Thu ==> Weekday.Thu
Fri ==> Weekday.Fri
Sat ==> Weekday.Sat

枚举类与错误综合小例子

>>> class Student(object):
...     def __init__(self,name,gender):
...          if not isinstance(gender,Gender):
...               raise TypeError('{}'.format('传入的性别类型异常'))
...          self.__name = name
...          self.gender = gender
...
>>> bart = Student('Bart', Gender.Male)
>>> if bart.gender == Gender.Male:
...     print('测试通过!')
... else:
...     print('测试失败!')
...
测试通过!
>>> bart = Student('Bart', '男')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<stdin>", line 4, in __init__
TypeError: 传入的性别类型异常
>>>

元类,我服了!!!

推荐一篇高分文章读懂元类

>>> def fn(self,world = 'world!'):
...     print('hello {}'.format(world))
...
>>> Hello = type('Hello',(object,),dict(hello = fn))
>>> h = Hello()
>>> h.hello()
hello world!


>>> class ListMetaclass(type):
...     def __new__(cls,name,bases,attrs):
...         attrs['add']=lambda self,value:self.append(value)
...         return type.__new__(cls,name,bases,attrs)
...
>>> class MyList(list,metaclass=ListMetaclass):
...     pass
...
>>> l = MyList()
>>> l.add(5)
>>> l
[5]

# 类是一种特殊的对象,因为python 是动态语言,可以后期绑定属性方法等

>>> class ObjectCreator():
...     pass
...
>>> print(ObjectCreator)
<class '__main__.ObjectCreator'>
>>> print(hasattr(ObjectCreator,'new_attribute'))
False
>>> ObjectCreator.new_attribute = 'foo'
>>> print(hasattr(ObjectCreator,'new_attribute'))
True
>>> ObjectCreatorMirror = ObjectCreator
>>> print(ObjectCreatorMirror())
<__main__.ObjectCreator object at 0x00859A30>

异常处理

>>> def div(a,b):
...     if not isinstance(a,int) or not isinstance(b,int):
...         raise TypeError('本方法中除数与被除数都要为整数!')
...     try:
...         r = a/b
...         print('r: {}'.format(r))
...     except ZeroDivisionError as e:
...         print('except: ',e)
...     finally:
...         print('finally...')
...     print('END...')

>>> r = div(1,2)
r: 0.5
finally...
END...
>>> div(1,0)
except:  division by zero
finally...
END...


>>> def foo(i):
...     return 10/i
...
>>> def bar(j):
...     return foo(j) *2

>>> def main(n):
...     try:
...         bar(n)
...     except ZeroDivisionError as e:
...         logging.exception(e)
...     finally:
...         print('end...')
...
>>> main(5)
end...
>>> main(0)
ERROR:root:division by zero
Traceback (most recent call last):
  File "<stdin>", line 3, in main
  File "<stdin>", line 2, in bar
  File "<stdin>", line 2, in foo
ZeroDivisionError: division by zero
end...


改错:

from functools import reduce

def str2num(s):
    try:
        r = int(s)
    except ValueError as e:
        if isinstance(s,str):
            s=s.replace('.','')
            r = int(s)
        else:
            raise ValueError('传入的不是字符串!')
    finally:
        pass
    return int(s)

def calc(exp):
    ss = exp.split('+')
    ns = map(str2num, ss)
    return reduce(lambda acc, x: acc + x, ns)

def main():
    r = calc('100 + 200 + 345')
    print('100 + 200 + 345 =', r)
    r = calc('99 + 88 + 7.6')
    print('99 + 88 + 7.6 =', r)

main()

既然如此重要,再谈元类

# 定义一个函数,用来待会儿在 类 内部或绑定,或调用
def print_s(s):
    print(s)


# 定义元类, 必须继承自 type 才可以被当做元类,被反射
class ObjectCreatorMetaClass(type):
    def __new__(current_class_name,class_tobe_created_name,base_classess_name_tuple,attrs_hold_dict):
        # 打印一波传进来的参数会发现基本跟命名一致
        print_s('current_class_name: {}'.format(current_class_name))
        print_s('class_tobe_created_name: {}'.format(class_tobe_created_name))
        print_s('base_classess_name_tuple: {}'.format(base_classess_name_tuple))
        print_s('attrs_hold_dict: {}'.format(attrs_hold_dict))
        
        
        #为要被创建的类 ObjectCreator 添加方法,属性都可以
        attrs_hold_dict['flag'] = True
        attrs_hold_dict['current_class_name_print'] = print_s(current_class_name)
        attrs_hold_dict['class_tobe_created_name_print'] = print_s(class_tobe_created_name)
        attrs_hold_dict['base_classess_name_tuple_print'] = print_s(base_classess_name_tuple)
        attrs_hold_dict['attrs_hold_dict_print'] = print_s(attrs_hold_dict)
        return type.__new__(current_class_name,class_tobe_created_name,base_classess_name_tuple,attrs_hold_dict)

# 定义我们要被创建的 类,为了方便查看传进去的 base_classess_name_tuple ,我们手动让他继承一下 object
class ObjectCreator(object,metaclass = ObjectCreatorMetaClass):
        pass
    
# 思考为什么 第一次打印时候 attrs_hold_dict 会比后一次 打印 少掉一部分属性,方法 (如 'current_class_name_print': None, 'flag': True)
# 因为这在传进来时候并没有绑定这些参数方法啊,是后面代码 手动绑定的啦 哈哈哈哈或或或

#  上面的理解有点偏差,但愿看到的人能够自己找出,下面是我重新理解的 
# 定义一个函数,用来待会儿在 类 内部或绑定,或调用
def print_s(s):
    print(s)
    return s

#必须继承自 type 才可以被当做元类,被反射
class ObjectCreatorMetaClass(type):
    def __new__(current_class_name,class_tobe_created_name,base_classess_name_tuple,attrs_hold_dict):
        # 打印一波传进来的参数会发现基本跟命名一致
        print_s('current_class_name: {}'.format(current_class_name))
        print_s('class_tobe_created_name: {}'.format(class_tobe_created_name))
        print_s('base_classess_name_tuple: {}'.format(base_classess_name_tuple))
        print_s('attrs_hold_dict: {}'.format(attrs_hold_dict))
        
        
        #为要被创建的类 ObjectCreator 添加方法,属性都可以
        attrs_hold_dict['flag'] = True
        attrs_hold_dict['get_metaclass'] = print_s(current_class_name)
        attrs_hold_dict['get_tobe_created_class'] = print_s(class_tobe_created_name)
        attrs_hold_dict['get_bases_classess_tuple'] = print_s(base_classess_name_tuple)
        attrs_hold_dict['get_attrs_hold_dict'] = print_s(attrs_hold_dict)
        return type.__new__(current_class_name,class_tobe_created_name,base_classess_name_tuple,attrs_hold_dict)

class ObjectCreator(object,metaclass = ObjectCreatorMetaClass):
        pass
    
# 思考为什么 第一次打印时候 attrs_hold_dict 会比后一次 打印 少掉一部分属性,方法 (如 'current_class_name_print': None, 'flag': True)
# 因为这在传进来时候并没有绑定这些参数方法啊,是后面代码 手动绑定的啦 哈哈哈哈或或或

object_from_objectcreator = ObjectCreator()
print(object_from_objectcreator.flag)


# 实际上这里返回了
object_from_objectcreator.get_metaclass
object_from_objectcreator.get_tobe_created_class
object_from_objectcreator.get_bases_classess_tuple
object_from_objectcreator.get_attrs_hold_dict


# out:
# current_class_name: <class '__main__.ObjectCreatorMetaClass'>
# class_tobe_created_name: ObjectCreator
# base_classess_name_tuple: (<class 'object'>,)
# attrs_hold_dict: {'__qualname__': 'ObjectCreator', '__module__': '__main__'}
# <class '__main__.ObjectCreatorMetaClass'>
# ObjectCreator
# (<class 'object'>,)
# {'get_bases_classess_tuple': (<class 'object'>,), '__qualname__': 'ObjectCreator', 'get_metaclass': <class '__main__.ObjectCreatorMetaClass'>, '__module__': '__main__', 'get_tobe_created_class': 'ObjectCreator', 'flag': True}
# True
# {'__module__': '__main__',
#  '__qualname__': 'ObjectCreator',
#  'flag': True,
#  'get_attrs_hold_dict': {...},
#  'get_bases_classess_tuple': (object,),
#  'get_metaclass': __main__.ObjectCreatorMetaClass,
#  'get_tobe_created_class': 'ObjectCreator'}


# 到目前为止,我认为元类来创建 类 ,然后 类再创建对象的过程
# 应该是 定义一个元类继承 type 这个 class  然后 覆写它的 __new__ 方法, TBD。。。

# 曾经沧海,写完下面这个自动转换要被创建的类的属性为大写 , 元类也就会了

class Upper_attr(type):
    def __new__(cls,name,bases,attr_dict):
        attr_dict = dict( (name.upper(),value)  for name,value in attr_dict.items() if not name.startswith('__'))
        print(attr_dict)
        return super(Upper_attr,cls).__new__(cls,name,bases,attr_dict)
    
class Foo(object,metaclass = Upper_attr):
    bar = 'bip'
    pass

hasattr(Foo,'BAR')
{'BAR': 'bip'}
True


# 思考为什么 构造函数 __init__ 不能用 lambda 来写函数体 , 因为,lambda 冒号后边必须接的是一个 表达式而非语句
def __init__(self, x):
    self.x = x

def printX(self):
    print(self.x)

Test = type('Test', (object,), {'__init__': __init__, 'printX': printX})
class TestMetaclass(type):
    def __new__(cls,name,bases,attr_dict):
        attr_dict['__init__'] = __init__
        attr_dict['printX']= lambda self:print(self.x)
        return super(TestMetaclass,cls).__new__(cls,name,bases,attr_dict)
    
class Test(object,metaclass = TestMetaclass):
    pass

Test('123').printX()

636379-20180606172351153-443757276.png

IO , 文件 , 内存, 字符,字节 类似于 java 的 IO

import os
file_list = os.listdir('.')
for file in file_list:
    file_name,file_extension = os.path.splitext(file)
    if file_extension == '.csv':
        try:
            f = open(file,'r')
            print(f.read())
            print('file name: ',file_name+file_extension)
        except IOError as ioe:
            print(e)
        finally:
            if f:
                f.close()
            
        print(file_name,'<----->',file_extension)


gender,age,drug,complication
0,1,3,5
1,3,2,3
0,5,1,2
0,2,3,3
1,7,3,2
0,6,3,4

file name: mock_data.csv
mock_data <-----> .csv

加上 编码,解码方式

file_list = os.listdir('.')
kw = {'encoding':'utf8'}
for file in file_list:
    file_name,file_extension = os.path.splitext(file)
    if file_extension == '.csv':
        try:
            f = open(file,'r',**kw)
            print(f.read())
            print('file name: ',file_name+file_extension)
        except IOError as ioe:
            print(e)
        finally:
            if f:
                f.close()
            
        print(file_name,'<----->',file_extension)


file_list = os.listdir('.')
kw = {'encoding':'utf8'}
for file in file_list:
    file_name,file_extension = os.path.splitext(file)
    if file_extension == '.csv':
        try:
            f = open(file,'r',**kw)
#             print(f.read())
            for line in f.readlines():
                print(line)
            print('file name: ',file_name+file_extension)
        except IOError as ioe:
            print(e)
        finally:
            if f:
                f.close()
            
        print(file_name,'<----->',file_extension)


# 使用 with 表达式,相当于 java 中的 try(Autoclosable Resources)   语法糖,自动关闭资源

file_list = os.listdir('.')
kw = {'encoding':'utf8','errors':'ignore'}
for file in file_list:
    file_name,file_extension = os.path.splitext(file)
    if file_extension == '.csv':
        with open(file,'r',**kw) as f:
            for line in f.readlines():
                print(line.strip()) # 去掉末尾的换行符
            
        print(file_name,'<----->',file_extension)

# 读写二进制文件 是不能加 errors 参数的
>>> with open('9.jpg','rb',errors='ignore') as fr:
...     with open('99.jpg','wb') as fw:
...          for line in fr.readlines():
...              fw.write(line)
...
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: binary mode doesn't take an errors argument

# StringIO , python 3 中 是 from io import StringIO ,内存读写
# 方式一:
f = StringIO()
f.write('Hello\nWorld!\n')
print(f.getvalue())

# 方式二:
from io import StringIO
f = StringIO('Hello\nWorld!\n')
# print(f.getvalue())
while True:
    s = f.readline()
    if s == '':
        break
    print(s.strip())

#  StringIO操作的只能是str,如果要操作二进制数据,就需要使用BytesIO。

#  BytesIO实现了在内存中读写bytes,我们创建一个BytesIO,然后写入一些bytes:

from io import BytesIO
f = BytesIO()
f.write('中文'.encode('utf-8'))
print(f.getvalue())
结果:

b'\xe4\xb8\xad\xe6\x96\x87'

# 解码:
from io import BytesIO
f = BytesIO(b'\xe4\xb8\xad\xe6\x96\x87')
bcontent = f.read()
print(bcontent.decode('utf-8'))
与上一种utf-8 编码相反,用 utf-8 解码, 结果如下:
'中文'

文件夹目录以及文件相关操作

# 在当前路径下查找包含指定字符串的 所有文件名,并返回。如果是子目录,需要用到递归,没有写,有空写写
import os
def search_file(filename):
    return [file for file in os.listdir('.') if os.path.isfile(file) and filename in file]

for name in search_file('并'):
    print(name)
并发症逻辑回归准确率.ipynb
并发症概率模型.ipynb

# api 集中:
os.path.isdir(x)
os.listdir('.')
os.path.isfile(x)
os.path.splitext(x)[1]=='.py'
os.name # 操作系统类型   nt 
os.uname() # 注意uname()函数在Windows上不提供,也就是说,os模块的某些函数是跟操作系统相关的。
os.environ # 在操作系统中定义的环境变量,全部保存在os.environ这个变量中,可以直接查看:
os.environ.get('PATH')
# 查看当前目录的绝对路径:
>>> os.path.abspath('.')
'/Users/michael'
# 在某个目录下创建一个新目录,首先把新目录的完整路径表示出来:
>>> os.path.join('/Users/michael', 'testdir')
'/Users/michael/testdir'
# 然后创建一个目录:
>>> os.mkdir('/Users/michael/testdir')
# 删掉一个目录:
>>> os.rmdir('/Users/michael/testdir')
# 对文件重命名:
>>> os.rename('test.txt', 'test.py')
# 删掉文件:
>>> os.remove('test.py')
>>> os.path.split('/Users/michael/testdir/file.txt')
('/Users/michael/testdir', 'file.txt')

但是复制文件的函数居然在os模块中不存在!原因是复制文件并非由操作系统提供的系统调用。理论上讲,我们通过上一节的读写文件可以完成文件复制,只不过要多写很多代码。

幸运的是shutil模块提供了copyfile()的函数,你还可以在shutil模块中找到很多实用函数,它们可以看做是os模块的补充。

序列化 (内存流向磁盘的过程)与 反序列化(磁盘流向内存的过程)

# 序列化
import pickle
person = {'name':'Bob','age':18,'gender':'Male'}
d = pickle.dumps(person)
with open('dump.txt','wb') as fw:
    pickle.dump(d,fw)
# 反序列化
with open('dump.txt','rb') as fr:
    d=pickle.load(fr)
    print(d)

序列化为json 串存储到磁盘, 反序列化从磁盘读取 json 串到内存转化为python对象

import json
person = dict(name = 'Tom',age = 18,gender='Male')
#  dumps 将dict 转成 json 字符串
j = json.dumps(person)
with open('json.txt','w') as fw:
    # dump 序列化 json 串为文件或类文件对象 (file-like Object)
    json.dump(j,fw)

# loads 方法将 json串反序列化
json.loads(j)
with open('json.txt','r') as fr:
    # load 方法将从文件中读取字符串并反序列化为json 串,同时你会发现是反序的
    k = json.load(fr)
    print(k)

再进一阶,序列化与反序列化 json 串 between 对象

import json
class Student(object):
    def __init__(self,name,age,sex):
        self.name = name
        self.age = age
        self.sex = sex
        
s = Student('Tom',18,'Male')
def student2str(std):
    return dict(name=std.name,age=std.age,sex=std.sex)
json.dumps(student2str(s))
json.dumps(s,default=lambda obj:obj.__dict__)

'{"sex": "Male", "age": 18, "name": "Tom"}'

#将上面的 json 字符串转换为 Student 对象
json_str = '{"sex": "Male", "age": 18, "name": "Tom"}'
def dict2student(d):
    return Student(d['name'],d['age'],d['sex'])
s = json.loads(json_str,object_hook=dict2student)
s.name

结果:
'Tom'
小结
Python语言特定的序列化模块是pickle,但如果要把序列化搞得更通用、更符合Web标准,就可以使用json模块。
json模块的dumps()和loads()函数是定义得非常好的接口的典范。当我们使用时,只需要传入一个必须的参数。但是,当默认的序列化或反序列机制不满足我们的要求时,我们#### 又可以传入更多的参数来定制序列化或反序列化的规则,既做到了接口简单易用,又做到了充分的扩展性和灵活性。

内建模块以及常用第三方模块

import urllib.request as urllib2
import random
ua_list=["Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv2.0.1) Gecko/20100101 Firefox/4.0.1",
        "Mozilla/5.0 (Windows NT 6.1; rv2.0.1) Gecko/20100101 Firefox/4.0.1",
        "Opera/9.80 (Macintosh; Intel Mac OS X 10.6.8; U; en) Presto/2.8.131 Version/11.11",
        "Opera/9.80 (Windows NT 6.1; U; en) Presto/2.8.131 Version/11.11",
        "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11"]
u_agent = random.choice(ua_list)
# print(u_agent)
url = 'http://www.baidu.com'
request = urllib2.Request(url=url)
request.add_header("User_agent",u_agent)
response = urllib2.urlopen(request)
print(response.read())

其他

标准数据类型
Python3 中有六个标准的数据类型:

Number(数字)
String(字符串)
List(列表)
Tuple(元组)
Sets(集合)
Dictionary(字典)
Python3 的六个标准数据类型中:

不可变数据(四个):Number(数字)、String(字符串)、Tuple(元组)、Sets(集合);
可变数据(两个):List(列表)、Dictionary(字典)。
Set(集合)
集合(set)是一个无序不重复元素的序列。

基本功能是进行成员关系测试和删除重复元素。

# 字符串的一些内建函数需要掌握 ,首字母大写 capitalize(),lower(),upper() 等等
a = 'frank'
a.capitalize()

可以使用大括号 { } 或者 set() 函数创建集合,注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。

# set可以进行集合运算
a = set('abracadabra')
b = set('alacazam')
 
print(a)
 
print(a - b)     # a和b的差集
 
print(a | b)     # a和b的并集
 
print(a & b)     # a和b的交集
 
print(a ^ b)     # a和b中不同时存在的元素

dict_1 = dict(name='frank',age=18)  # 这写法我喜欢
dict_1 = {'name':'frank','age':18}  # 这写法也能接受
dict_1 = dict([('name','frank'),('age',18)])   # 这种写法我觉得纯粹是有病。。。


删除引用,估算引用,查询引用
del b
eval('b') 
hex(id(b))   # 16 进制 hash值
# str()出来的值是给人看的。。。repr()出来的值是给python看的,可以通过eval()重新变回一个Python对象
a = 'a'
eval('a')
hex(id(a))
eval(repr(a))

# print 默认输出是换行的,如果要实现不换行需要在变量末尾加上 end="":
# 不换行输出
print( x, end=" " )
print( y, end=" " )
dict  items() , keys(), values()
list  pop , append
import keyword
keyword.kwlist

#  dict 是个好命令
dir(dict)
'__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'clear',
 'copy',
 'fromkeys',

636379-20180614172745469-1697836617.png
636379-20180614173008955-842967537.png

python 日志

# 这段代码保存为 config.py
# -*- coding: utf-8 -*-
__author__ = 'Frank Li'
import logging
class Config():
    # 创建一个logger
    logger = logging.getLogger('statisticNew')
    logger.setLevel(logging.DEBUG)

    # 创建一个handler,用于写入日志文件
    fh = logging.FileHandler('test.log')
    fh.setLevel(logging.DEBUG)

    # 再创建一个handler,用于输出到控制台
    ch = logging.StreamHandler()
    ch.setLevel(logging.DEBUG)

    # 定义handler的输出格式
    formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
    fh.setFormatter(formatter)
    ch.setFormatter(formatter)

    # 给logger添加handler
    logger.addHandler(fh)
    logger.addHandler(ch)
    def getLog(self):
        return self.logger

引用上段代码保存的额 config.py 文件里的module

__author__ = 'Frank Li'
from config import Config
if __name__ == '__main__':
    conf = Config()
    logger = conf.getLog()
    logger.info('foorbar')
    boy = "Frank Li"
    is_handsome = True
    logger.info("boy=%s,is_handsome=%s",boy,is_handsome)
   
# 异常处理,以后尽量不要用山寨的 print 了

try:
   ....  
except Exception as e:
    logger.exception('ERROR readFile:%s,%s' % (path,str(e)))

编码规范 , 变量定义

#  Python变量命名用法(一般变量、常量、私有变量、内置变量)
#coding:utf8
__author__ = "libingxian"

class TestDemo(object):
    """
    Python变量命名用法(以字符或者下划线开头,可以包括字母、数字、下划线,区别大小写)
    一般变量
    常量
    私有变量
    内置变量
    """
    FINAL_VAR = "V1.0" # 常量,不可修改的变量,以大写字母或加下划线命名,这个只是约定,即使更改了也不会报错

    class_name = "TestDemo" # 常见变量命名,

    __maker__ = 'libingxian' # 内置变量,两个前置下划线和两个后置下划线,内置对象所具有,声明时不可与内置变量名的重复

    def __init__(self):
        self.__private_var = "private" # 私有变量,以两个前置下划线开头,只能在本类中使用,类外强制访问会报错
        self.public_var = "public" # 一般变量

    def __private_method(self):# 私有方法,以两个下划线开头、字母小写,只能在本类中使用,类外强制访问会报错
        print "i am private"

    def public_method(self):
        print "i am public"

test_demo = TestDemo()
print test_demo.FINAL_VAR # 访问常量
print test_demo.public_var # 访问一般变量
print test_demo.__private_var # 访问私有变量,运行会报错
test_demo.__private_method() # 访问私有方法,运行会报错

字典操作 dict_1.update(dict_2) 合并 dict

dict_1 = {'name':'Frank','age':18}
gender_dict = {'gender':'Male'}
dict_1.update(gender_dict)
print(dict_1)

字典推导式

mcase = {'a': 10, 'b': 34, 'A': 7, 'Z': 3}

mcase_frequency = {
    k.lower(): mcase.get(k.lower(), 0) + mcase.get(k.upper(), 0)
    for k in mcase.keys()
}

# mcase_frequency == {'a': 17, 'z': 3, 'b': 34}

# key,value 交换
>>> {value:key for key,value in dict_1.items()}
{'Frank': 'name', 18: 'age'}

由 两个 list 合并 dict 原理是利用 zip 合并成 ((key1,value1),(key2,value2)) 然后用 dict[key] = value 方式

list_1 = ['name','age']
list_2 = ['Frank',18]
person_dict = {}
for key,value in zip(list_1,list_2):
    person_dict[key] = value
print(person_dict)

# 反过来   zip(*zipped)   ==> flattern
dict_2 = dict(name='Frank',age=18)
list_3,list_4 = zip(*[ [key,value] for key,value in dict_2.items()])
list_3,list_4

list 去重

# 方法一 
l1 = ['b','c','d','b','c','a','a']
l2 = {}.fromkeys(l1).keys()
print(l2)
# 方法二
l3 = list(set(l1))

# 方法三
>>> a=[1,2,4,2,4,5,7,10,5,5,7,8,9,0,3]
>>> a.sort()
>>> a
[0, 1, 2, 2, 3, 4, 4, 5, 5, 5, 7, 7, 8, 9, 10]
>>> last = a[-1]
>>> for i in range(len(a)-2,-1,-1):
...     if last == a[i]:
...         del a[i]
...     else:
...         last = a[i]
...
>>> a
[0, 1, 2, 3, 4, 5, 7, 8, 9, 10]

# 封装成方法 distinct
>>> def distinct(lst):
...     lst.sort()
...     last = lst[-1]  # 这里不正向的原因是lst长度会改变
...     for i in range(len(lst)-2,-1,-1): # 倒序来比较列表
...         if last == lst[i]:
...             del lst[i] # 如果与已经有的值相同则删除
...         else:    # 否则则将 last 指向前一个元素
...             last = lst[i]
...     return lst
distinct([1,2,4,2,4,5,7,10,5,5,7,8,9,0,3])


# 三元运算  还可以用 元组条件表达式的三元运算   is_fat =('not fat','fat') [is_state]
>>> is_state = True
>>> is_fat = 'fat' if is_state else 'not fat'
>>> is_fat
'fat'

# 优雅地查出重复数据
>>> str_list = ['a','b','a','c','d','b','c']
>>> [s for s in str_list if str_list.count(s) >1]
['a', 'b', 'a', 'c', 'b', 'c']
>>> set([s for s in str_list if str_list.count(s) >1])
{'a', 'c', 'b'}

# 求交集 差集
>>> str_list2 = ['a','b']
>>> str_list = set([s for s in str_list if str_list.count(s) >1])
>>> str_list.intersection(str_list2)
{'a', 'b'}
>>> str_list.difference(str_list2)
{'c'}

列表排序

列表排序

    a = [(1, 2), (4, 1), (9, 10), (13, -3)]
    a.sort(key=lambda x: x[1])

    print(a)
    # Output: [(13, -3), (4, 1), (1, 2), (9, 10)]

列表并行排序

list_1 = [8,4,3,2,7,6,5]
list_2 = ['e','d','c','y','i','o','p']
data = zip(list_1,list_2)
data = sorted(data)
list1, list2 = map(lambda t: list(t), zip(*data))
print(list1)
print(list2)

模拟 with open

>>> class File(object):
...    def __init__(self,file_name,method):
...        self.file_obj = open(file_name,method)
...    def __enter__(self):
...        return self.file_obj
...    def __exit__(self,type,value,traceback):
...        self.file_obj.close()
...
>>> with File('C:/Users/FrankLi/Desktop/Demo.java','r') as f:
...     for line in f.readlines():
...         print(line)
...
class Demo{

        public static void main(String[] args){

                System.out.println("Hello world!");

        }

}
我们的__exit__函数接受三个参数。这些参数对于每个上下文管理器类中的__exit__方法都是必须的。我们来谈谈在底层都发生了什么。

with语句先暂存了File类的__exit__方法
然后它调用File类的__enter__方法
__enter__方法打开文件并返回给with语句
打开的文件句柄被传递给opened_file参数
我们使用.write()来写文件
with语句调用之前暂存的__exit__方法
__exit__方法关闭了文件

类似于 scala 的 flattern 列表展平

>>> import itertools
>>> a_list = [[1,2],[3,4],[5,6]]
>>> print(itertools.chain(*a_list))
<itertools.chain object at 0x039E6090>
>>> print(list(itertools.chain(*a_list)))
[1, 2, 3, 4, 5, 6]
>>> print(list(itertools.chain.from_iterable(a_list)))
[1, 2, 3, 4, 5, 6]

>>> l = [[1,2,3],[4,5,6], [7], [8,9]]
>>> [item for sublist in l for item in sublist] # 推导式中两层 for 循环也可以实现
[1, 2, 3, 4, 5, 6, 7, 8, 9]

for - else 结构

for n in range(2, 100):
    for x in range(2, n):
        if n % x == 0:
            print(n, 'equals', x, '*', n / x)
            break
    else:
        # loop fell through without finding a factor
        print(n, 'is a prime number')
# 替代 switch case 方案 字典映射
>>> def switch(x):
...     return {'0':0,'1':1,'2':2}.get(x,'nothing')
...
>>> switch('0')
0
>>> switch('3')
'nothing'

16.检查一个字符串是否是一个数字?

In[22]: x = '569789'

In[23]: x.isdigit()

Out[23]: True

In[24]: y = 'gdf2667'

In[25]: y.isdigit()

Out[25]: False

17.查找列表中某个元素的下标?

In[26]: ['a','b','c'].index('b')

Out[26]: 1

18.如何在列表中随机取一个元素?

import random

f= ['a', 'b', 'c']

print(random.choice(f))
# 字典排序
>>> dict_1 = {'a':3,'b':1,'c':2}
>>> sorted(dict_1.items(),key=lambda x:x[1])
[('b', 1), ('c', 2), ('a', 3)]

>>> import operator
>>> file_dict={"a":1,"b":2,"c":3}
>>> sorted(file_dict.items(),key = operator.itemgetter(1),reverse=True)
[('c', 3), ('b', 2), ('a', 1)]
# 字符串的不可变形 = immutability
Str1 = 'Yuxl'
print(Str1)
try:
    Str1[0] = 'XX'
except:
    print("不可更改")
Yuxl
不可更改

>>> import random
>>> def g_rand_range(max):
...     for i in range(1,max+1,1):
...         yield random.randint(1,10)
...
>>> for i in g_rand_range(10):
...     print(i)

别人的总结图

Python 基础知识总结图

JAVA vs PYTHON (还没细看)

jvsp

总结:

至此,关于 python 基础的总结基本完结,其中有涉及到高阶知识 , 元类,位置参数关键字参数 可变参数(*args type: tuple,**kwargs type: dict),
生成器,装饰器,函数式编程风格的 map reduce filter sorted上下文管理器, 要补充的有 : 进程线程协程,异步io
接下来的时间应该是 学习 python 的重要常用模块(Pandas,Numpy,Scipy,PIL pillow , opencv,sk-learn,xgboost,爬虫库 scrappy等)以及框架(Django)

最后感慨一下,如果一开始碰到了python 也许根本就不会去学java了,感觉python的设计思想比较符合我的思想各种黑魔法的魅力吸引着我!!!
(虽然java不可否认也是一门优雅的工程化设计语言但不够精简,语法冗长)。。。life is short , I use python and java ! 其实语言本身没有好坏,
只有适用场景(多一门语言能力便多一种工具,而工具可以提高效率!),

每一门语言都有自己的设计思想,一个合格的程序员应该多学几门语言,了解怎样用不同的方法和思维去解决同一个问题。因此学习多门并不仅仅是为了更好的装逼!!!

我曾经还一直在想为什么没有出现一门语言一统天下呢 现在想想也是天真。。。
不过语言始终流于招式,接下来是要修炼一波内功了,算法才是灵魂!

转载于:https://www.cnblogs.com/Frank99/p/9111124.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python爬虫笔记,python基础知识,以TXT文件呈现 一、概述 Python是著名的“龟叔”Guido van Rossum在1989年圣诞节期间,为了打发无聊的圣诞节而编写的一个编程语言。 Python为我们提供了非常完善的基础代码库,覆盖了网络、文件、GUI、数据库、文本等大量内容,被形象地称作“内置电池(batteries included)”。用Python开发,许多功能不必从零编写,直接使用现成的即可。 龟叔给Python的定位是“优雅”、“明确”、“简单”,所以Python程序看上去总是简单易懂,初学者学Python,不但入门容易,而且将来深入下去,可以编写那些非常非常复杂的程序。 那Python适合开发哪些类型的应用呢? 首选是网络应用,包括网站、后台服务等等; - PythonWeb 其次是许多日常需要的小工具,包括系统管理员需要的脚本任务等等; - Python 另外就是把其他语言开发的程序再包装起来,方便使用。 - 胶水语言 在 爬虫 科学计算 等领域有独特优势 AI Python的优点 简单易学 完善的语言特性 天然开源 丰富的社区支持 Python的缺点。 第一个缺点就是运行速度慢,和C程序相比非常慢,因为Python是解释型语言,你的代码在执行时会一行一行地翻译成CPU能理解的机器码,这个翻译过程非常耗时,所以很慢。而C程序是运行前直接编译成CPU能执行的机器码,所以非常快。 但是大量的应用程序不需要这么快的运行速度,因为用户根本感觉不出来。例如开发一个下载MP3的网络应用程序,C程序的运行时间需要0.001秒,而Python程序的运行时间需要0.1秒,慢了100倍,但由于网络更慢,需要等待1秒,你想,用户能感觉到1.001秒和1.1秒的区别吗?这就好比F1赛车和普通的出租车在北京三环路上行驶的道理一样,虽然F1赛车理论时速高达400公里,但由于三环路堵车的时速只有20公里,因此,作为乘客,你感觉的时速永远是20公里。 第二个缺点就是代码不能加密。如果要发布你的Python程序,实际上就是发布源代码,这一点跟C语言不同,C语言不用发布源代码,只需要把编译后的机器码(也就是你在Windows上常见的xxx.exe文件)发布出去。要从机器码反推出C代码是不可能的,所以,凡是编译型的语言,都没有这个问题,而解释型的语言,则必须把源码发布出去。 二、安装配置 安装包下载地址: http://www.python.org/download/ Python目前分为两大版本,互不兼容: 2.x.x 3.x.x 下载的时候要注意区分 根据需要的版本进行下载 目前两者都有所使用 双击安装 设置环境变量: 将python安装位置配置到PATH环境变量下。 三、运行方式 shell方式: 在cmd窗口中输入python进入命令行模式 在其中以交互式方式执行 shell方式调用py文件: 在文件中编写Python脚本 文件后缀为.py 进入该文件所在目录 直接执行./xxx.py IDE模式: pycharm pyDev for Eclipse **Python编码 Python默认读取py文件时采用的编码格式是 ASCII 格式,如果文件不是该格式很可能出现乱码问题造成异常。 解决方法为只要在文件开头加入 # -*- coding: UTF-8 -*- 或者 #coding=utf-8 来通知Python解释器在读取文件时采用的编码集 四、标识符 在 Python 中,所有标识符可以包括英文、数字以及下划线(_),但不能以数字开头。 Python 中的标识符是区分大小写的。 以下划线开头的标识符是有特殊意义的。 以单下划线开头 _foo 的代表不能直接访问的类属性,需通过类提供的接口进行访问,不能用 from xxx import * 而导入; 以双下划线开头的 __foo 代表类的私有成员;以双下划线开头和结尾的 __foo__ 代表 Python 里特殊方法专用的标识,如 __init__() 代表类的构造函数。 五、语言细节 1.语句 Python通常一行为一条语句 不需要分号标识 Python 可以同一行显示多条语句,方法是用分号 ; 案例: print 'hello';print 'runoob'; 也可以使用反斜杠将一行语句分为多行解释: 案例: total = item_one + \.....................................................
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值