04_Python简答题

在这里插入图片描述

博文配套视频课程:Python面试题与面试技巧


Python有哪方面的应用

  1. 常规软件研发,支持B/S、C/S架构:Python支持函数式编程和OOP面向对象编程,能够承担任何种类软件的开发工作,因此常规的软件开发、脚本编写、网络编程等都属于标配能力
  2. 科学计算:掌握语言:numpy、pandas、matplotlib 等库的兴起,让Python越来越适合做科学计算、绘制高质量的2D和3D图像
  3. 自动化运维:Python的简单、高效是运维工程师的首选,Python在运维方面已经深入人心,Saltstack就是大名鼎鼎的自动化运维平台
  4. 云计算:开源云计算解决方案OpenStack就是基于Python开发的
  5. Web开发:Python有很多的Web开发框架,例如:Django、Flask,其中Pytohn + Django应用范围非常广泛,速度快,学习门槛也低,能够帮助快速搭建可用的Web服务
  6. 网络爬虫:也称网络蜘蛛,是大数据行业获取数据的核心工具。没有网络爬虫自动地、不分昼夜地、高智能地在互联网上爬取免费的数据,那些大数据相关的公司恐怕要少四分之三,而Python中基于爬虫的Scrapy框架绝对是目前的中流砥柱
  7. 机器学习与人工智能:在大量数据的基础上,结合科学计算、机器学习、深度学习、神经网络来让数据产生巨大的价值,而基于Python的sklearn、以及googl开源的TensorFlow深度学习框架绝对是目前学习人工智能的首选语言

简单说明机器学习的步骤

  1. 获取数据:read_csv | read_xls | from sklearn.datasets | dataset.make_moons | scrapy
  2. 数据清洗:isnull, notnull、fillna、dropna、astype、pd.cut 对数据
  3. 特征工程:One-hot PCA PolynomialFeatures
  4. X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=1),交叉验证 (训练集又分为训练集和验证集)
  5. 选择合适的模型:线性回归、逻辑回归、K-means、决策树、决策回归、集成学习、随机森林、TensorFlow、贝叶斯
  6. 模型优化 超参数 (对超参数进行网格搜索)、特征工程(PCA)、准确率、精确率、召回率、欠拟合、过拟合、增加样本数量、删除异常点、
  7. 保存与加载:job.load、job.dump

实例、类属性以及实例、类静态方法的区别

在Python中一切皆对象,类是一个特殊的对象即类对象,描述类的属性称为类属性,它属于类。类属性在内存中只有一份,所有实例对象公用,在__init__外部定义。实例属性:用来描述类创建出来的实例对象,需要通过对象来访问,在各自对象的内存中都保存一份,在__init__方法内部定义

class Person():
    count = 0  # 此处i为类属性

    def __init__(self, name):
        self.name = name  # 此处name为实例属性
        Person.count += 1

    def show(self):
        print(self.name)


per = Person("张三")  # 实例化
print(per.name)
# 类属性,实例和类都可以访问
print(per.count,Person.count)
# 实例属性,类不能访问
print(Person.name)
  1. 实例方法由对象调用,至少一个self参数,self代表对象的引用。
  2. 类方法由类调用,至少一个cls参数,并且需要装饰器@classmethod修饰
  3. 静态方法由类调用,不需要参数,需要装饰器@staticmethod修饰
# 类属性与实例属性的区别
class Person():
    count = 0  # 此处i为类属性

    # 实例对象和类对象都可以调用。
    @classmethod
    def add(cls):
        cls.count += 1

    # 静态方法主要是用来存放逻辑性的代码,逻辑上属于类,但是和类本身没有关系,
    # 也就是说在静态方法中,不会涉及到类中的属性和方法的操作。可以理解为,
    # 单纯的函数,它仅仅托管于某个类的名称空间中,便于使用和维护。

    @staticmethod
    def method():
        print('static method........')

    def __init__(self, name):
        self.name = name  # 此处name为实例属性
        Person.add() # self.add()

    # 只能由实例对象调用
    def show(self):
        print(self.name)

per = Person("张三")  # 实例化
print(per.name)
# 类属性,实例和类都可以访问
print(per.count, Person.count)
# 实例属性,类不能访问
# print(Person.name)
per.show()
per.method()
Person.method()

Python机器学习算法简介

  1. 机器学习和深度学习目的:根据现有的数据经验对未来进行预测

  2. 所有算法本质都是数学函数,机器学习的过程就是找到函数的参数,以让函数曲线尽量拟合数据的过程 (误差值变小的过程)

  3. 不那么精确,却是比没有算法要可靠, 机器学习不探究事物的本质,不追求精确模型,只用基本的模型算法,直接以数据驱动预测

  4. 机器学习算法分类:

    4.1 监督学习:有标签(预测结果)

    4.2 分类:对离散型变量预测的监督学习算法,定性输出,邮件过滤,金融欺诈

    4.3 回归 (权重 + 偏值)、逻辑回归 (权重 + 偏值 + 决策边界)、KNN (K近邻)、决策树 (信息熵)、贝叶斯 (TF-IDF)、向量机 (寻找最大间隔)、随机森林、集成学习

  5. 无监督学习无标签(预测结果)聚类:数据没有标注,基于数据内部结构寻找样本的自然集群、新闻聚类、文章推荐

物联网、大数据、云计算、人工智能之间的关系

物联网 + 互联网 (生产数据的永动机)

源源不断的提供数据。淘宝网近4亿的会员每天产生的商品交易数据约20TB;脸书约10亿的用户每天产生的数据超过300TB

大数据

保存和关联数据,为何要联系起来呢?因为将事物和信息联系起来后,数据才有了关联,数据有了关联才能产生更大的价值。例如一辆车的位置数据没有太大价值,但几千辆车的位置数据关联起来,就可以用来判断路面拥堵情况,也可以用于交通调度。

  1. Volume(大量)
  2. Variety(多样):关系数据、图片、音视频、非关系型数据
  3. Velocity(高速):数据分析的实时性要求,例如滴滴打车
  4. Value(价值),一般我们称之为4V。可以通过模型,挖掘出对未来趋势从而提高生产效率、提升用户体验 (双11之前的物流)

云存储与云计算

成千上万台电脑和服务器连接成一片电脑云。因此,云计算甚至可以让你体验每秒10万亿次的运算能力,拥有这么强大的计算能力可以模拟核爆炸、预测气候变化和市场发展趋势。用户通过电脑、笔记本、手机等方式接入数据中心,按自己的需求进行运算。快速部署和拓展、稳定性强、安全可靠、易于整合、低成本等。对企业来说拥有云计算服务,就相当于获得了最顶尖的IT 基础设施。在传统模式中,企业需要购买自己的硬件和软件系统,这就需要内部IT 人员进行维护。随着将业务转移到云中,企业不需要雇佣之前那么多的IT 维护人员,减少了人力成本。

人工智能

人工智能在大数据的基础上更进一步,人工智能会分析数据,然后根据分析结果做出行动,例如无人驾驶,自动医学诊断。并且随着自动学习自我进化模型会越来越智能

在这里插入图片描述

在这里插入图片描述

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值