-介绍-
使用SAS超过5年后,我决定离开我的舒适圈。作为一名数据科学家,寻找其他有用的工具是必须的。幸运的是,我没有花太多时间来决定 - Python是我的目标对象。
我不喜欢复杂编码,事实证明,编码实际上非常简单!
我在一周内学会了Python的基础知识。而且,从那时起,我不仅深入探索了这种语言,而且还帮助了许多其他人学习这门语言。Python最初是一种通用语言。但是,多年来通过强大的社区支持,这种语言得到了专门的数据分析库和预测建模库支持。
本次<人人都是数据科学家>长系列教程中,我们将通过“预测一个贷款是否会被批准”、“室内用户运动预测“、“使用机器学习和深度学习预测股票价格”多个案例项目从头开始用Python学习数据科学。
-P1准备阶段-
用于数据分析的Python基础知识
如何安装Python?
安装Python有两种方法:
-
您可以直接从其官方网站下载Python并安装所需的单个组件和库
-
或者,您可以下载并安装包含预安装库的软件包。我建议下载Anaconda。
第二种方法提供了无忧安装,因此我建议初学者使用。使用这种方法是你必须等待整个包升级,即使你对单个库的最新版本感兴趣。除非您正在进行前沿的统计研究,否则无关紧要。
选择开发环境
安装Python后,有多种选择环境的选项。以下是3种最常见的选项:
- 基于终端/外壳
- IDLE(默认环境)
- Jupyter notebook
- …
虽然合适的环境取决于您的需求,但我个人更喜欢Jupyter notebook。它在编写代码本身时为文档提供了很多的功能,例如Markdown。你可以选择以组块的形式运行代码(而不是逐行执行)。
我们将使用Jupyter环境来完成这个完整的教程。
Python库和数据结构
Python数据结构
以下是一些在Python中使用的数据结构。您应该熟悉它们,以便在适当时使用它们。
-
列表 - 列表是Python中最通用的数据结构之一。可以通过在方括号中编写逗号分隔值列表来简单地定义列表。 列表可能包含不同类型的项目,但通常项目都具有相同的类型。Python列表是可变的,列表的各个元素可以更改。
-
字符串 - 字符串可以简单地通过使用单(’),双(“)或三(”’)引号来定义。用牛栏引号(“’)括起来的字符串可以跨越多行,并且经常在文档字符串中使用(Python的记录函数的方式)。\用作转义字符。请注意,Python字符串是不可变的,因此您无法更改部分字符串。
-
元组 - 元组由逗号分隔的多个值表示。元组是不可变的,输出由括号括起,以便正确处理嵌套的元组。此外,即使元组是不可变的,如果需要,它们也可以保存可变数据。由于元组是不可变的并且无法更改,因此与列表相比,它们的处理速度更快。因此,如果您的列表不太可能更改,则应使用元组而不是列表。
-
Dictionary - Dictionary是一组无序的Key,一对大括号创建一个空字典: {}。
Python迭代和条件构造
像大多数语言一样,Python也有一个FOR循环,它是最广泛使用的迭代方法。它有一个简单的语法:
for i in [Python Iterable]:
expression(i);
这里“Python Iterable”可以是列表,元组或其他高级数据结构,我们将在后面的章节中探讨。让我们看一个简单的例子,确定一个数字的阶乘。
fact=1
for i in range(1,N+1)
face*=1;
来到条件语句,它们根据条件执行代码片段。最常用的构造是if-else,语法如下:
if [condition]:
__execution if ture__
else:
__execution if false__;
例如,如果我们要打印数字N是偶数还是奇数:
if N%2=0:
print('Even')
else:
print('Odd');
既然您已经熟悉Python基础知识,那么让我们更进一步。如果您必须执行以下任务,该怎么办
-
乘以2个矩阵
-
找到二次方程的根
-
绘制条形图和直方图
-
制作统计模型
-
访问网页
如果你试图从头开始编写代码,它将成为一场噩梦,你将不会在Python上停留超过2天!但不要担心。值得庆幸的是,有许多预定义的库,我们可以将它们直接导入到我们的代码中,让我们的生活更轻松。
例如,考虑我们刚看到的阶乘示例。我们可以一步完成:
math.factorial(N);
当然,我们需要为此导入数学库。下一篇P2让我们来探讨各种数据科学库。
如果您想支持小编,不用您赞赏,更需要您的转发!阅读数是小编文章最直观的感受。
如有疑问咨询请加官微:fintechapplab!