py笔记

最新推荐文章于 2023-01-23 15:07:17 发布

夏光芒

最新推荐文章于 2023-01-23 15:07:17 发布

阅读量271

点赞数 1

分类专栏： python

本文链接：https://blog.csdn.net/xiaguangmang/article/details/87259986

版权

python 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

数据挖掘和机器学习步骤：（1）数据预处理；（2）数据建模；（3）数据验证

python帮助文档

一、python实现决策树功能

    import numpy as np
    import pandas as pd
     def main():
	    from sklearn.datasets import load_iris  #数据预处理
	    iris=load_iris()
	    print(iris)
	    print(len(iris["data"]))
    from sklearn.eross_validation import train_test_split
    from sklearn import tree   #数据建模（决策树，分类器）
    from sklearn import metrics  #验证（准确率，混淆矩阵）

二、Python 人工网络—keras/ tensorflow(谷歌的开源框架，windows环境下不太成熟)

keras安装
1.Anaconda CMD–Anaconda 命令窗口
2.conda install mingw libpython
3.pip install keras
1.算法
聚类 K-Means
统计学习 SVM EM
关联分析 Apriori
链接挖掘 PageRank
集装与推进 AdaBoost
分类 KNN Naive Bayes CART
2.应用：（1）关联规则；（2）聚类（用户细分，精准营销）；（3）朴素贝叶斯（垃圾邮件识别）和决策树；（4）ctr预估（搜索排序）和协同过滤（商品推荐）

三、python案例

案例1：有4个数字1，2，3，4能够组成多少个互不相同且无重复数字的三位数
分析1：可填在百位，十位，各位的数字都是1，2，3，4.组成所有的排列后去掉不满足条件的数字（数字有相同或重复的数字）

     Num=[1,2,3,4]
    i=0
    For a in num:
       For b in num:
          For c in num:
         If(a!=b) and (b!=c) and (a!=c):
    i+=1
    print(a,b,c)
    print(“总数是:”,i)

减少冗余循环的写法：

    Num=[1,2,3,4]
    i=0
      for a in num:
         for b in num:
           if(a==b):
             continue;
           for c in num:
               if(c==b or c==a):
                    continue;
    i+=1
    print(a,b,c)
    print(“总数是：”i)

python自带函数的处理办法

    from itertools import permutations
    for i in permutations([1,2,3,4],3):
    	print(i)

案例二：企业发放奖金根据利润。利润（i）低于或等于10万元时，奖金可提10%；利润高于10万元低于20万元时，低于10万元部分按照10%提成，高于10万元的部分，提成7.5%；20万到40万之间时，高于20万的可提成5%；40万到60万之间高于40万元的部分可提成3%；60万到100万之间高于60万元的部分可提成1.5%；高于100万元时，超过100万元的部分按照1%提成，键盘输入利润I,求应发奖金总数。
直接采用if else方法来实现：

    Import sys
    """
     From imp import reload  #重载，目的是设置python 解释器的编码规则、
    Reload(sys)
    Sys.setdefaultencoding(‘utf-8’)
    """
    X=int(input(“净利润：”)) #转换成长整型
    If(x<=100000):
    	Bonus=x*0.1
    	Print(‘奖金：’,bonus,’元’)
    elif(100000<x<=2000000):
    	Bonus=100000*0.1+(x-100000)*0.075
    	Print(‘奖金：’,bonus,’元’)
    elif(200000<x<=4000000):
	    bonus=10000+7500+(x-200000)*0.05
	    Print(‘奖金：’,bonus,’元’)
    elif(400000<x<=6000000):
	    bonus=10000+7500+10000+(x-400000)*0.03
	    Print(‘奖金：’,bonus,’元’)
    elif(600000<x<=10000000):
	    bonus=10000+7500+10000+6000+(x-600000)*0.015
	    Print(‘奖金：’,bonus,’元’)
    else:
	    bonus=10000+7500+10000+6000+6000+(x-1000000)*0.01
	    Print(‘奖金：’,bonus,’元’)

使用python函数方法实现：

    Def get_reward(i):
	    Rewards=0
	    If(i<=10):
	    	Rewards=i*0.1
	    elif(10<i<=20):
	    	rewards=(i-10)*0.075+ get_reward(10)
	    elif(20<i<=40):
	    	rewards=(i-20)*0.05+ get_reward(20)
	    elif(40<i<=60):
	    	rewards=(i-40)*0.03+ get_reward(40)
	    elif(60<i<=100):
	    	rewards=(i-60)*0.015+ get_reward(60)
	    else
	    	rewards=(i-100)*0.01+ get_reward(100)
    if __name__==’__main__’:
	    i=int(input(“净利润：”))
	    print(“发放的奖金为：”,get_reward(i/10000)*10000)

案例三：一个整数，他加上100是一个完全平方数，再加上168又是一个完全平方数，请问该数是多上？
分析：设该整数为x
X+100=n平方x+100+168=m平方=>m平方-n平方=168 =>(m+n)×(m-n)=168
令m+n=i，m-n=j
则 i×j=168
由 i>0 j>0 推出 i%2=0 j%2=0
由 168=2×2×2×3×7
上面两个条件推出i与j值的范围[2,4,6,12,14,28,42,84]
反推：m=(i+j)/2和n=(i-j)/2 并且 n>0 推得 i>j
则 i=[14,28,42,84]
j=[12,6,4,2]

      list1=[14,28,42,84]
      list2=[12,6,4,2]
        for iin range(0,4):
           m=(list1[i]+list2[i])/2
           n=(list1[i]-list2[i])/2
           x=n*n-100
        print(‘符合条件整数：’,x)

案例四：打印9x9乘法表

i = 0
while i<9 :
    i += 1
    j = 0
    while j < i:
        j += 1
        print("%d * %d = %d" %(j,i,i*j),end = '\t\t')
    print()

案例五：用python解数独

""" 数独是 9 横 9 竖共有 81 个格子，同时又分为 9 个九宫格。
    我们填写数独的顺序是将 9 个九宫格按照从左到右，从上到下
    的顺序排列，再将每个九宫格内部的空白格按照从左到右，从
    上到下的顺序排列，依次按照顺序填写空白格。"""

""" 解此种数独用达不到默认递归的深度
import sys  
sys.setrecursionlimit(100000) # 发现python默认的递归深度是很有限的
                              #（默认是1000），因此当递归深度超过999的
                              # 样子，就会引发这样的一个异常。
"""


def get_next(m:"数独矩阵", x:"空白格行数", y:"空白格列数"):
    """ 功能：获得下一个空白格在数独中的坐标。       
    """
    for next_y in range(y+1, 9):  # 下一个空白格和当前格在一行的情况
        if m[x][next_y] == 0:
            return x, next_y
    for next_x in range(x+1, 9):  # 下一个空白格和当前格不在一行的情况
        for next_y in range(0, 9):
            if m[next_x][next_y] == 0:
                return next_x, next_y
    return -1, -1               # 若不存在下一个空白格，则返回 -1，-1
        
def value(m:"数独矩阵", x:"空白格行数", y:"空白格列数"):
    """ 功能：返回符合"每个横排和竖列以及
              九宫格内无相同数字"这个条件的有效值。
    """ 
    i, j = x//3, y//3
    grid = [m[i*3+r][j*3+c] for r in range(3) for c in range(3)]
    v = set([x for x in range(1,10)]) - set(grid) - set(m[x]) - \
        set(list(zip(*m))[y])    
    return v

def start_pos(m:"数独矩阵"):
    """ 功能：返回第一个空白格的位置坐标"""
    for x in range(9):
        for y in range(9):
            if m[x][y] == 0:
                return x, y
    return -1, -1  # 若数独已完成，则返回 -1, -1

def try_sudoku(m:"数独矩阵", x:"空白格行数", y:"空白格列数"):
    """ 功能：试着填写数独 """    
    for v in value(m, x, y):
        if m[x][y] == 0:  # 判断是否为空格
            m[x][y] = v
            next_x, next_y = get_next(m, x, y)            
            if next_y == -1: # 如果无下一个空白格
                print(m)
                return True
            else:
                end = try_sudoku(m, next_x, next_y) # 递归
                if end:
                    return True
                m[x][y] = 0 # 在递归的过程中，如果数独没有解开，
                            # 则回溯到上一个空白格    

def sudoku(m):        
    x, y = start_pos(m)
    """ 解数独的一个结果
    try_sudoku(m, x, y)
    """
    # 解数独的所有结果
    for v in value(m, x, y):        
        m[x][y] = v
        next_x, next_y = get_next(m, x, y)
        try_sudoku(m, next_x, next_y)
             

                    
if __name__ == "__main__":
    m = [
        [6, 0, 0, 1, 0, 0, 7, 0, 8],
        [0, 0, 0, 8, 0, 0, 2, 0, 0],
        [2, 3, 8, 0, 5, 0, 1, 0, 0],
        [0, 0, 0, 0, 4, 0, 0, 9, 2],
        [0, 0, 4, 3, 0, 8, 6, 0, 0],
        [3, 7, 0, 0, 1, 0, 0, 0, 0],
        [0, 0, 3, 0, 7, 0, 5, 2, 6],
        [0, 0, 2, 0, 0, 4, 0, 0, 0],
        [9, 0, 7, 0, 0, 6, 0, 0, 4]
    ]

    sudoku(m)

四、python开发基础

1.python基础
1）基础
（1）文件后缀名为.py
（2）两种执行方式：py文件路径；进入解释器实时输入并获取执行结果；
（3）变量：只能由字母，数字，下滑线组成，但是变量不能用数字开头，关键字不能作为变量使用；
2）基本数据类型
（1）运算符：+ - * / % // ； in ,not in：判断字符是否在某个字符串中，但必须连续（子字符串，子序列）
（2）数字：在python中不管数字有多大都是int：（num,base=16）–按照进制转换；bit_length()—至少用多少二进制位表示；
（3）字符串：魔法函数：capitalize()—首字母大写；casefold()/lower—转换小写，casefole()可转换特殊字符；format()—将字符串中的占位符替换为指定的值；partition()做‘分割，只能分三份；split()可以全部分割，可以指定分割几个
（4）列表:可以是数字，字符串，列表，布尔值—所有的都能放进去。列表的存储形式像链表，存值的同时，存了下一个元素的地址，非连续存储，可以修改；列表有序；
（5）元组：元素不可被修改（元组的一级元素），不能被增加或者删除；元组也有序；
（6）字典：字典的value可以是任意值，字典的key值---------布尔值，列表，字典，集合不可以成为字典的键值；字典是无序的；不可切片；keys()，values()，items()。
（7）布尔值：bool(…) None、””、0、（）、{}、[]、set -------------->结果为None
（8）集合：不同元素组成，元素全部无序，可哈希（不可变数据类型）
求交集&（intersection）；求并集 |（union）；求差– （difference）；
交叉补集 ^（symmetric_difference）除交集之外的部分；

数字：int(…)
字符串：replace、find、join、strip、startswith、split、upper、lower、format
列表：append、extend、insert | 索引，切片，循环元组：索引，切片，循环元素不能被修改
字典：get、update、keys、values、items | for 索引

字符串格式化（%，format）：%s：传一个字符串（可以接收任何值）；%d：传一个数字；%f（%.nf）：传带有n位小数的浮点数；%.nf%%：打印百分比； “I am {0},age{1},{2}”.format（”alex”,18,”seven”）：依元组下标匹配传值；
“I am {name},age {age},really
{name}”.format(name=”seven”,age=18)：依键值传值；
.format(**{“key”:values})

3）函数
逻辑结果化和过程化的一种编程方法；过程是简单特殊没有返回值的函数。
函数参数：
（1）形参：形参变量只有在被调用时才分配内存单元，调用结束即刻释放分配的内存单元，因此形参只在函数内部有效。
（2）实参：可以是常量，变量，表达式，函数等，
（3）位置参数，关键字参数，位置参数必须在关键字参数左边；
默认参数def func(x,y=None)
（4）参数组：** 字典，* 列表
（5）全局变量：文件开头，没有缩进，整个文件都可以使用。
（6）局部变量：子程序中定义的变量就是局部变量，前方有缩进。
（7）global：全局变量，找到最外层的变量，nonlocal指定上一级变量。
（8）前向引用：（函数即变量）
4）函数递归：不断调用自身，直到返回一个结果，必须要有结束条件否则会形成死循环，递归的效率不高，递归过多容易形成栈溢出。
5）作用域：？？？
6）匿名函数：lambda定义：lambda x（形参）:x+1（处理的表达式）相当于函数中return的值。如果要打印需要一个值去接收，返回一个函数地址，加（）传参即可得到结果。
7）函数式编程
面向过程：一步一步执行，中间参与处理过程；
函数式编程：编程语言定义的函数+ 数学意义的函数。
（1）不可变：不用变量保存状态，不修改变量；
（2）第一类对象，函数即变量；
（3）高阶函数：把函数当做参数传给另一个函数名；返回值中包含函数；
（4）尾调用：在函数的最后一步调用另一个函数。
（5）map函数：map（lambda x:x+1,num_1）返回一个迭代器（只迭代一次），打印时可list化一下，处理序列中的每个元素，得到一个顺序和原有列表形式相似的’列表’。
（6）filter函数：filter（函数，可迭代对象）返回的也是一个迭代器，打印时需要list化一下，该函数用于筛选，去重等,遍历序列中的每个元素，判断每个元素得到布尔值，如果是True则留下来。
（7）reduce函数：合并一个系列，得到一个最终的值，返回一个确切的值。
（8）文件处理：打开文件–>通过文件句柄对文件进行操作–>关闭文件
f.seek（10）:指定光标的位置为10，默认从文件头开始；
f.tell（）:显示当前光标的位置；
f.flush（）将内容从内存中刷新到存储中；
with open（’文件名’，’打开方式’，encoding=’utf-8’，newline=’’）as f ；
for i in f: 循环文件，要一行取一行，节省内存；
8.迭代器和生成器
迭代器：
8.1）迭代器协议：对象必须提供一个next方法，执行该方法要么返回迭代中的下一项，要么就引起一个stopiteration异常，以终止迭代；
8.2）可迭代对象：实现了迭代器协议的对象；for调用__iter__()方法将对象转换成遵循迭代器协议的对象；再做一个错误处理机制；
生成器：可以理解为一种数据类型，这种数据类型自动实现了迭代器协议，生成器就是可迭代对象。
8.3）生成器函数：常规函数定义，但是用yield语句而不是用return语句返回结果，yield一次返回一个结果，自动实现迭代器协议（自动实现next（）方法，无需再去调用__iter__（）方法）；
生成器的好处是延迟计算，一次返回一个结果，生成器只能遍历一次。
8.4）三元表达式：’SB’ if name == ‘alex’ else ‘帅哥’：if后为True返回’SB’，’False’返回else后的结果；
L=[‘a’ for I in rang(10)]：列表解析式（列表推导式）
g_l=（‘a’ for I in rang(10)）：生成器表达式
9.深浅拷贝
9.1）深拷贝：deepcopy（）克隆一份，需要单独模块执行copy，copy.deepcopy（list）；
9.2）浅拷贝：copy（）只拷贝第一层，更深层共享，如l=[[1,2],3,4]，b=l.copy（）–>重新存3,4，共享[1,2]；
10.装饰器
本质就是函数，为其他函数添加附加功能。原则：不修改被装饰函数的源代码；不修改被装饰函数的调用方式。
三要素：基本实现 |参数| 返回值
10.1）装饰器的知识储备：装饰器=高阶函数+函数嵌套+闭包
高阶函数：函数的参数是一个函数名；函数的返回值是一个函数名；满足上述任一条件就是高阶函数。

     def foo():
               print(‘你好凌师傅！’)
          def test(func):
               print(func)
               func()
          test(foo)#test就是一个高阶函数，实参是一个函数

10.2）函数嵌套：在函数内部再定义函数 def
10.3）闭包：跟作用域性质类似，定义函数嵌套，优先寻找本层定义变量，再一层层往外找，最外层变量可以渗透到最内层。
10.4）@timmer 相当于test = timmer(test) test为被装饰函数。
10.5）解压序列：l=[1,2,3,4] a.*d,c=l a=1,d=[2,3],c=4
10.6）已经写好的装饰器加参数：再做函数嵌套然后传参（闭包可以将最外层参数传到最里层）。

五、面向对象

1.三大编程范式
（1）面向过程编程
（2）函数式编程
（3）面向对象编程
1.1）类：
把一类事物的相同特征和动作整合到一起就是类，类是一个抽象概念；类是一种数据结构，就好比一个模型，该模型用来表示一类事物，用它来产生真实的物体；数据结构本质上是一个字典（类属性字典）。
当类之间有显著的不同，并且较小的的类是较大类所需要的组件时，用组合比较好，当类之间有很多相同的功能时，提取这些共同的功能做成基类，用继承比较好。
对象：就是基于类而创建的一个具体的事物，也是特征和动作整合到一起；数据与函数整合到一起的产物；
面向对象编程：用定义类+实例/对象的方法去实现面向对象的设计；
实例化：立即触发init函数，由类产生对象的过程叫做实例化，实例化的结果就是一个对象，或者说就是一个实例。
属性：数据属性（变量）某些共有特征
函数属性 :共同存在的动作
实例：直接使用类的__init__()初始化，得到自己的实例属性字典，实例首先在自己的属性字典中查找，找不到就继续往上找（类中找），类似于作用域的效果；
静态属性：即数据属性，类提供装饰器@property将函数属性变成数据属性，实例对象在调用函数属性的时候不用加()了，直接 . 函数名就好了；property可以将函数逻辑给封装起来，调用时感受不到；跟实例绑定；
类方法：@classmethod装饰的方法称为类方法，该方法可供类使用，不需要实例，方法中自动参数（cls）,该参数自动接收类名；跟类绑定；
静态方法：@staticmethod，不再绑定实例或者类，不能调用类变量和实例变量，是类的工具包；
组合：类和类之间有某种关系，做类和类的关联；
面向对象编程特性：
继承：class B(A):类B继承于类A；子类继承了父类的所有属性，子类先寻找自己的属性，找不到再到父类去找，子类定义的属性和父类重名了，也不会覆盖父类。
继承有两种含义：
①继承基类的方法，并且做出自己的改变或者扩展（代码重用）
②申明某个子类兼容于某基类，定义一个接口类，子类继承接口类，并且实现接口中定义的方法；
③接口继承：导入模块abc,将基类定义成接口，如：

    class A（metaclass=abc.ABCMeta）:
    @abc.abstractmethod
    def a1():
        pass

限定后，子类继承了他，就必须实现接口类中的方法，否则就无法实例化，实现归一化设计；
④继承顺序：深度优先或广度优先。对于每定义的一个类，python会计算出一个方法解析顺序（MRO）列表，这个MRO列表就是一个简单的所有基类的线性顺序列表，为了实现继承python会从这个列表上从左到右开始查找基类，知道找到第一个匹配这个属性的类为止。新式类采用广度优先继承，基类继承object类，经典类基类也是经典类（不继承object）,采用深度优先继承。
在子类中调用父类的方法：super().父类方法—>实现在子类中继续使用父类方法。这样做子类中不用出现父类名，不用传self参数，可扩展性强。
多态：不同的对象可以调用相同的方法。对象通过他们共同的属性和动作来操作及访问，而不需考虑他们具体的类；反应在运行时状态（继承的一种体现机制）；
封装：将某些数据属性和函数属性隐藏起来，使用层面无法知道背后的逻辑。_a表示类内部定义的属性，不影响调用（但是这个标识告诉你该属性不应该在外部被调用）；__A在生成类的属性字典时，Python会自动重命名为_类名__A，此时外部也能访问，如果直接访问__A是不行的，在内部使用完全没有问题,但是可以在类内部封装一个接口函数可供外部调用。
自省：程序能够自己检测自己，又叫反射，主要用于面向对象。
python提供四个函数：
hasattr(object,name):判断object中有没有一个name字符串对应的方法或属性，有True；
getattr(object,name,default值):得到object中字符串name的值，如果找不到返回default值;
setattr(x,y,v):x表示对象，y对应字典键，v对应字典值（x对象的属性字典）：x.y=v；
delattr(x,y):删除对象x的y属性:del x.y；

__getattr__:只有在对象调用的属性不存在时会触发；
__delattr__:删除时就触发；
__setattr__:设置对象属性时就会触发；
isinstance(obj,cls):检查obj是否是类cls的对象；
issubclass(sub,super)：检查sub类是否是super类的派生类；
__getattribute__():不管实例属性是否存在，都会运行；
__getitem__:使用[]操作字典时触发
__setitem__:使用[]操作字典时触发
delitem:使用[]操作字典时触发
__str__：可以自定制对象的显示方式
format:format(d1)–>__format__(d1):可以定制自己的格式化格式
__repr__:repr(f1)–>f1.__repr__()在解释器当中会触发，如果找不到str(),就找repr()作为str()的替代品；
__slots__:是一个类变量，变量值可以是列表，元组，或者可迭代对象，也可以是一个字符串，定义在类中的；字典会占用大量的内存，为节省内存可以使用__slots__代替__dict__(当一个类的属性不多，但产生的对象（实例）特别多时)，定义完__slots__后，类的__dict__方法失效，__slots__限定了属性的个数。
上下文管理__enter__和__exit__：文件操作中，打开关闭文件时调用，上下文管理（即with语句）：
with open(‘atxt’) as f:执行__enter__返回一个对象给f，with中的代码块执行完后执行__exit__;
动态导入模块：__import__(‘m1.t’)–>此时导入的只是模块m1,无论几层导入的都是最顶层模块；import * 不导入定义的私有属性；importlib模块可导入整个字符串（importlib.import_module()）；
析构方法：当对象在内存中被释放时，自动触发执行，此方法无需定义，析构函数的调用由python解释器的垃圾回收触发，如__del__;
__next__和__iter__ 方法：实现迭代器协议（迭代器中必备的两个方法）；
描述符：描述符是一个新式类，至少实现了__get__(),__set__(),__delete__()中的一个，也被称为描述符协议；描述符用来代理另外一个类的属性的（必须把描述符定义成这个类的类属性，不能定义到构造函数中）。被代理的属性统统归代理管。描述符优先级如下：
1.类属性
2.数据描述符(实现了__set__方法就是数据描述符。)
3.实例属性
4.非数据描述符
5.找不到的属性触发__getattr__()
类的装饰器
类似于函数的装饰器，在类实例化之前可以操作类属性
元类（metaclass）:类的模板，是生成类的类，type是一个内建元类–>type(类名，（object,）,{})
2.异常处理
2.1）错误：语法错误、逻辑错误
2.2）异常：程序运行时发生错误的信号，常用的异常类：
异常处理的目的是使有错误的程序不至于崩溃，使程序具有健壮性和容错性。

    try:
    #逻辑块
    raise ………  #主动触发异常
    except Exception as e:#（万能异常捕捉，可以抛出任何异常）
   # 捕捉到异的异常信息的处理
               else: 
                   try  #代码块没有异常则执行
    finally:
    #无论异常与否，都会执行该模块，通常是进行清理工作

2.3）断言：断定某个判定，assert 1==2,相当于做if判断并抛出异常。

夏光芒

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
py笔记

数据挖掘和机器学习步骤：（1）数据预处理；（2）数据建模；（3）数据验证一、#python实现决策树功能 import numpy as np import pandas as pd def main(): from sklearn.datasets import load_iris #数据预处理 iris=load_iris() prin...
复制链接

扫一扫

专栏目录