《利用Python进行数据分析》读书笔记(一)Python Basic

这一系列博客是看《Python for Data Analysis》的读书笔记,只截取了大部分自己认为重要的知识点,不少例子也是来自于书中。本机安装的是python 3.6版本,并使用anaconda安装了jupyter notebook和一些常用模块。

Python Interpreter

在终端命令行输入python指令后调出python交互界面,使用exit()或者Ctrl+D退出python交互界面。在命令行通过python 文件名.py的方式执行python脚本。

$ python hello_world.py
Hello world

IPython Basic

  1. 在命令行输入ipython命令调出ipython交互界面。ipython界面与python界面的区别自己尝试过就能感觉到。

  2. 在命令行输入jupyter notebook命令调出jupyter notebook,当然前提是已经安装了jupyter notebook,jupyter notebook可以很好地将文字与代码合并在一起,是一个很好的工具。

  3. Tab用来在写代码的时候提供提示,起到了代码补全的作用。

    In [1]: an_apple = 27
    
    In [2]: an_example = 42
    
    In [3]: an<Tab>
    an_apple and an_example any

    这里定义了两个an开头的变量,引用变量时输入an后按下tab键会提示出两个可能的选项,如果没有多个选项那么按下tab可以直接补全变量名。能提示的不仅是变量名,还有可能的函数,函数的参数等等,与在开发环境中写代码时软件自带的代码提示功能类似。

  4. 用来显示某个函数或变量的详细信息,相当于文档的功能。

    In [1]: a=[1,2,3]
    
    In [2]: a?
    Type:        list
    String form: [1, 2, 3]
    Length:      3
    Docstring:  
    list() -> new empty list
    list(iterable) -> new list initialized from iterable's items
    
    In [10]: print?
    Docstring:
    print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False)
    Prints the values to a stream, or to sys.stdout by default.
    Optional keyword arguments:
    file: a file-like object (stream); defaults to the current sys.stdout. sep: stringinsertedbetweenvalues,defaultaspace.
    end: stringappendedafterthelastvalue,defaultanewline.
    flush: whether to forcibly flush the stream.
    Type: builtin_function_or_method

    a?会显示出列表的种类、长度等所有详细属性,print?则会显示出函数的一些用法和说明。

  5. ??用来显示自定义函数的源码,用法:函数名??

Python Language Basic

  1. Python相对于C语言或者java语言来说,一个特点就是使用空格取代括号,例如for循环和if语句写法如下:

    for x in array: 
        if x < pivot:
             less.append(x) 
        else:
            greater.append(x)
  2. python在每行语句结束时不需要分号结尾

  3. python中的数字、字符串、数据结构、函数、类都是一个python object,有其内部的type和属性。

  4. 使用# 注释内容进行注释。

  5. 在python中,对一个变量赋值即创造了一个引用指向等号右边的元素。例如:

    In [3]: a
    Out[3]: [1, 2, 3]
    
    In [4]: b=a
    
    In [5]: a.append(4)
    
    In [6]: b
    Out[6]: [1, 2, 3, 4]

    将a赋值给b时,此时a和b都是指向列表的引用,a和b任意一方对列表进行修改后,另一方的值也会被修改,因为两者的指向是相同的。

a、b都是指向list的一个引用

  1. 对于大多数语言来说,'5'+5的结果可能是10(将’5’转换成int类型的5),也可能是55(将5转换成str类型的’5’),原因是这些语言支持对不同类型变量操作时的自动转换类型。上述情况在python中会直接报错,因为操作的两者数据类型不同。但是在一些很明显的情况下,也是可以执行的,比如4.5/2,一个是float,一个是int,但是得出的结果仍然是float类型的2.25。

  2. isinstance(变量,数据类型)方法可以判断变量是否是某个类型,返回值为TrueFalse。其中数据类型的位置可以为一个元组,意思是判断某个变量是否为多个数据类型中的某个类型。

    In[21]:a=5
    In [22]: isinstance(a, int)
    Out[22]: True
    
    In[23]:a=5;b=4.5
    In [24]: isinstance(a, (int, float))
    Out[24]: True
    In [25]: isinstance(b, (int, float))
    Out[25]: True
  3. 对于一个python object,它有很多属性与方法,getattr()方法可以获取这些方法与属性的反射。例如:字符串a有一个split方法,要获取这个方法本身,可以使用如下代码:

    In [27]: getattr(a, 'split')
    Out[27]: <function str.split>
  4. 使用import 模块的方式导入模块,这个不说了。

  5. 运算符操作,即‘+’、‘-’、‘*’、‘/’等等运算符的操作。

  6. is is not ,用法为a is/is not b,用于判断a、b两者的引用是否指向相同元素,常用于判断变量是否为空,需要注意与==的区别,后者是判断两者的内容是否相同。

  7. 大部分Python Object是可变的,也就是说它们的值可以在定义后被修改。

  8. python中,int类型可以存任意位数的整数,float类型默认是64位的浮点数。

  9. 如果想实现c风格整型除法的效果,可以使用 //符号。例如:

    In[52]:3/2 
    Out[52]: 1.5
    
    In[53]:3//2 
    Out[53]: 1
  10. 使用单引号双引号表示字符串,多行字符串使用三个双引号。

    a = 'one way of writing a string'
    b = "another way"
    c="""
    This is a longer string that 
    spans multiple lines
    """

    Python字符串是不可修改的,字符串定义后就不能使用赋值语句再对其内部字符重新修改。但是可以通过函数修改。

    In [56]: a = 'this is a string'
    In [57]: a[10] = 'f' 
    ----------------------------------------------TypeError Traceback (most recent call last) <ipython-input-57-5ca625d1e504> in <module>()
    ----> 1 a[10] = 'f'
    TypeError: 'str' object does not support item assignment
    
    In [58]: b = a.replace('string', 'longer string')
    In [59]: b
    Out[59]: 'this is a longer string'
  11. 使用str(value)函数可以将value转成字符串(str)类型。

  12. 在定义字符串的时候,如果不想使用转义字符,那么可以在字符串之前加上r(由raw单词而来)。例如:

    In [69]: s = r'this\has\no\special\characters'
    
    In [70]: s
    Out[70]: 'this\\has\\no\\special\\characters'

    如果想表明定义的字符串是byte类型,那么可以在字符串之前加上b(由单词byte而来)。例如:

    In [85]: bytes_val = b'this is bytes'
    In [86]: bytes_val
    Out[86]: b'this is bytes'
  13. 字符串的格式化format(),用法为模板.format(参数...)。例如:

    In [74]: template = '{0:.2f} {1:s} are worth US${2:d}'
    In [75]: template.format(4.5560, 'Argentine Pesos', 1)
    Out[75]: '4.56 Argentine Pesos are worth US$1'

    模板中的3个{}内容意思如下:

    • {0:.2f}表示将第一个参数格式化为两位小数的浮点数。
    • {1:s}表示将第二个参数格式化为一个字符串。
    • {2:d}表示将第三个参数格式化为一个整数。

    format的参数分别对应模板中的三个参数。

  14. 格式转换函数,float(value)value转成float类型; int(value)value转成int类型,其他类似的函数如byte()bool()同理。

15 . 复合条件语句。使用一个简短的语句来代表一个判断的逻辑操作。复合条件语句的格式如下:

value = true-expr if condition else false-expr

翻译成常规语句就是:

python
if condition:
value = true-expr
else:
value = false-expr

举个例子:

python
In[126]:x=5
In [127]: 'Non-negative' if x >= 0 else 'Negative'
Out[127]: 'Non-negative'

翻译过来就是:

python
if x >= 0:
print('Non-negative')
else:
print('Negative')

补充材料

  1. 《利用Python进行数据分析》(http://vdisk.weibo.com/s/CRSj_HCw6WR6
  2. https://www.jianshu.com/c/52882df3377a?order_by=top
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
学习数据分析是当代信息时代的一项重要技能,Python作为一种强大的编程语言,是数据分析的热门工具之一。以下是我在学习利用Python进行数据分析过程中的一些笔记。 首先,学习Python的基础知识是必不可少的。了解Python的基本语法、数据类型、循环和条件语句等知识对于数据分析的学习非常重要。我通过自学网课和阅读相关书籍,逐渐掌握了Python的基础知识。 其次,学习使用Python数据分析库。在Python中,有很多强大的数据分析库,例如NumPy、Pandas和Matplotlib等。我通过学习这些库的用法,掌握了数据的处理、清洗、分析和可视化的技巧。我学习了如何使用NumPy进行矩阵运算和数值计算,如何使用Pandas进行数据处理和数据操作,以及如何使用Matplotlib进行数据可视化。 除了数据分析库,学习Python的机器学习库也是必不可少的。机器学习在数据分析中扮演着重要角色,Python中有很多优秀的机器学习库,例如Scikit-learn和TensorFlow。我通过学习这些库的使用,了解了机器学习的基本概念和常用算法,例如回归、分类和聚类等。我也学习了如何使用这些库来构建和训练机器学习模型。 最后,实践是学习的关键。在学习的过程中,我通过实践项目来巩固所学知识。我选择了一些真实的数据集,并运用Python数据分析技术进行数据处理、分析和可视化。通过实践,我不仅掌握了数据分析的具体步骤和方法,还锻炼了自己解决实际问题的能力。 总的来说,学习利用Python进行数据分析需要掌握Python的基础知识、数据分析库和机器学习库的使用,同时也需要通过实践项目来巩固所学知识。这个过程需要持续不断的学习和实践,但是通过不断的努力和实践,我相信能够掌握Python进行数据分析的技能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值