python爬虫基础与数据分析及可视化基础一、Python基础二、Python爬虫三、数据分析基础四、数据可视化基础

python基础、爬虫、数据分析学习笔记

  • 一、Python基础
  • * I. 基本数据类型 
    
    •   * i. int、float、str、bool数据类型的定义 
      
      • ii. tuple(元组):
      • iii. list(列表)
      • iv. set(集合):
      • v. dict(字典)
    • II. 基本控制结构
    •   * i. if-elif-else语句: 
      
      • ii. for语句:
      • iii. while语句
      • iv. in,and,or,break,contiue语句
    • III. 函数定义:
    • IV. 文件读取
  • 二、Python爬虫
  • * I. 获取本地用户代理信息 
    
    • II. Requests库
    •   * i. requests的安装 
      
      • ii. requests、Cookie免登陆、Session保持会话
    • III. 正则表达式
    • IV. 筛选网页信息
  • 三、数据分析基础
  • * I. Jupyter Notebook 数据分析及可视化工具 
    
    •   * i. jupyter notebook的安装 
      
      • ii. 使用jupyter notebook进行数据可视化的基本配置
    • II. Pandas、numpy、matplotlib库的安装:
    • III. Pandas的基本使用
    •   * i. Pandas读取文件 
      
      • ii. Pandas.Series的基本语法
      • iii. pandas.Dataframe的基本语法
    • IV. 数据处理
  • 四、数据可视化基础
  • * I. 画布 
    
    •   * i. 创建画布 
      
      • ii. 自定义画布大小并在指定位置创建坐标系
    • II. 条形图
    •   * i. 在一个坐标轴上绘制两个条形图 
      
      • ii. 横向条形图
    • III. 折线图
    • IV. 饼图

一、Python基础

  1. python中变量的定义不用在变量名前面声明变量类型,编译器会根据赋值的数值区分数据类型
  2. 字符串用单引号 'python' 或者双引号 "python" 均可
  3. python对代码书写格式做出了严格的要求,用缩进替换了传统 "{}" 表示语句作用范围的方式

I. 基本数据类型

数据类型 表达式
int 整形
float 浮点型
str 字符型
bool 布尔类型
tuple 元组
list l列表
set 集合
dict 字典

i. int、float、str、bool数据类型的定义

    a = 1  # int
    b = 1.1  # float
    c = 'python'  # str
    d = True  # bool
    print('a:', type(a), 'b:', type(b), 'c:', type(c), 'd:', type(d), sep='\n')
    
    #输出结果:
    a:
    <class 'int'>
    b:
    <class 'float'>
    c:
    <class 'str'>
    d:
    <class 'bool'>

ii. tuple(元组):

元组和列表相似,但一旦确定无法无法更改,即无法增加或者删除某个元素,只能删除整个元组

    # 创建元组
    tuple1 = ()  # 空元组
    tuple2 = (1,)  # 单个元素,","不能少
    tuple3 = (1, 2, 3, "python", "java")  # 多个元素
    print(tuple1, tuple2, tuple3, sep='\n')
    '''
    输出结果:
    ()
    (1,)
    (1, 2, 3, 'python', 'java')
    '''
    
    # 访问元素
    print(tuple3[1])  # 下标访问
    print(tuple3[0:2:1])  # 切片访问
    '''
    输出结果:
    2
    (1, 2)
    '''
    
    # 删除元组
    del tuple2
    
    # 元素个数
    print(len(tuple3))
    '''
    输出结果:
    5
    '''
    
    # 元素遍历
    for Member in tuple3:
        print(Member)
    for i in range(len(tuple3)):
        print(tuple3[i])
    '''
    输出结果:
    1
    2
    3
    python
    java
    1
    2
    3
    python
    java
    '''
    

iii. list(列表)

    # 创建列表
    List1 = []  # 空列表
    List2 = [1, 2, "python", "java"]  # 普通列表
    List3 = [[1, 2], ["python", "java"]]  # 复合列表
    print(List1, List2, List3, sep='\n')
    '''
    输出结果:
    []
    [1, 2, 'python', 'java']
    [[1, 2], ['python', 'java']]
    '''
    
    # 访问元素
    print(List2[0])  # 输出第一个元素
    print(List2[0:2:1])  # 输出从0每次增一到2-1位置的元素,输出结果一个列表
    '''
    输出结果:
    1
    [1, 2]
    '''
    
    # 插入元素
    List2.append("c++")  # 插入字符串'c++'
    print(List2)
    '''
    输出结果:
    [1, 2, 'python', 'java', 'c++']
    '''
    
    # 删除元素
    List2.remove(1)  # 删除第1个元素
    print(List2)
    del List2[1]  # 删除下标为1的元素
    print(List2)
    List2.pop()  # 删除末尾元素
    print(List2)
    List2.clear()  # 清空列表元素,操作后为空列表
    print(List2)
    del List2  # 删除整个列表
    '''
    输出结果:
    [2, 'python', 'java', 'c++']
    [2, 'java', 'c++']
    [2, 'java']
    []
    '''
    
    # 元素个数
    print(len(List3))
    '''
    输出结果:
    2
    '''
    
    # 元素反转
    List3.reverse()
    print(List3)
    '''
    输出结果:
    [['python', 'java'], [1, 2]]
    '''
    
    # 元素遍历
    for Member in List3:
        print(Member)
    for i in range(len(List3)):
        print(List3[i])
    '''
    输出结果:
    ['python', 'java']
    [1, 2]
    ['python', 'java']
    [1, 2]
    '''

iv. set(集合):

满足数学上对集合的定义,无序,互异,所以集合中不存在重复的元素,即有去重功能,也不能通过下标来访问某个元素,只能判断集合中是否存在某个元素

    # 创建集合
    set1 = set()
    set2 = {1, 2, 'python', 'java'}
    set3 = {(1, 2), 'python', 'java'}
    print(set1, set2, set3, sep='\n')
    '''
    输出结果:
    set()
    {1, 2, 'java', 'python'}
    {'java', 'python', (1, 2)}
    '''
    
    # 判断某个元素是否存在
    print('python' in set2)
    '''
    输出结果:
    True
    ''&
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
《零基础Python爬虫数据分析与可从入门到精通》是一本帮助零基础学习Python爬虫数据分析与可的书籍。通过阅读该书并实践书中的案例,读者可以从入门到精通地掌握这些技术。 首先,书籍的第一部分主要介绍了Python基础知识。包括Python的安装、基本语法、数据类型、条件语句、循环结构、函数、模块等内容。通过学习这些基础知识,读者可以对Python有一个全面的了解,并为后续的爬虫数据分析与可打下坚实的基础。 接下来,书籍的第二部分开始介绍爬虫的相关知识。包括HTTP协议、正则表达式、XPath、BeautifulSoup、Scrapy等内容。通过学习这些知识,读者可以了解爬虫的基本原理,并学会使用相关工具进行网页数据的抓取和解析。 然后,书籍的第三部分介绍了数据分析的相关知识。包括数据清洗、数据处理、数据等内容。通过学习这些知识,读者可以了解如何处理和分析不同类型的数据,并使用常用的数据分析工具进行数据。 最后,书籍的第四部分综合运用前面学习到的知识,通过实例项目来提高读者的实战能力。例如,通过爬取网站上的数据,然后进行数据分析和可展示。 综上所述,《零基础Python爬虫数据分析与可从入门到精通》这本书通过详细的讲解和实例项目,帮助读者从零开始学习Python爬虫数据分析与可,并最终达到精通的水平。对于想要学习这些技术的读者来说,这是一本很好的入门指南。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值