大数据的python基础_大数据量化之路之python基础

最新推荐文章于 2023-08-25 16:27:15 发布

weixin_39959349

最新推荐文章于 2023-08-25 16:27:15 发布

阅读量201

点赞数

文章标签：大数据的python基础

一、计算机运行基本原理及python基础

在了解计算机运行基本原理之上，理解python程序运行基本原理。做好数据分析准备工作。

安装好Anaconda做好相应变量配置，下载cmd工具Conemu，利用Anaconda工具安装配置好jupyternotebook。

二、jupyternotebook上的代码示例

打开conemu，输入命令 conda env list 查看所创建的虚拟环境，选择第二个虚拟环境，打开jupyternotebook进行代码练习。

打开jupyternotebook如下图：

建立了以python3为基础的代码练习,点击左上角的File可以对文件进行保存，输出为各种格式。按Run为运行(或者ctrl+Enter)命令，code为代码输出。

三、python脚本常用结构

四、代码练习实例

#!/usr/bin/env python

# coding: utf-8

# In[1]:

print("hello world")

# In[2]:

name = 'python3:猴子数据分析社群'

# In[3]:

name

# # 如何盖房子

# ## 第1步房子设计

# ## 第2步地基(数据分析运行环境)

# ## 第3步准备材料(数据)

# ## 第4步组合材料(函数，条件判断，循环)

# In[4]:

nameStr = '马云'

nameStr2 = '有钱'

print(nameStr + nameStr2)

# In[66]:

str1 = '我叫%s ,俺爹是 %s' % ('王思聪'，'王健林')

print(str1)

# In[ ]:

# In[11]:

age = 50

# In[13]:

money = 3.53

# In[16]:

namelist = ['猴子','马云','王健林','马化腾']

namelist

# In[19]:

namelen = len(namelist)

print('列表长度:病人数目:',namelen)

# In[23]:

namelist.append('刘强东')

print('增加一个元素：',namelist)

# In[24]:

del namelist[1]

print(namelist)

# In[26]:

name1 = namelist[0]

print (name1)

# In[27]:

print(namelist[0])

namelist[0] = '孙悟空'

print(namelist[0])

# In[29]:

gafataTuple = ('腾讯','阿里巴巴','苹果','谷歌','Facebook','亚马逊')

gafatalen=len(gafataTuple)

print(gafatalen)

print(gafataTuple[0])

# In[30]:

gafatasets= {'腾讯','阿里巴巴','苹果','谷歌','Facebook','亚马逊','亚马逊'} # 容器，集合(sets)是一个没有重复元素的容器

print(gafatasets)

# In[32]:

stocksets = set()

stocksets.update(['腾讯','阿里巴巴','京东'])

print(stocksets)

# In[34]:

stocksets.discard('京东')

print(stocksets)

# In[35]:

txBOOL = '腾讯' in stocksets

print(txBOOL)

# In[36]:

stocksets.discard('京东')

stocksets.update(['京东'])

print(stocksets)

# In[15]:

patientDic2 ={'001':['猴子',29,'1型糖尿病','较差'],

'002':['马云',34,'2型糖尿病','好转'],

'003':['王健林',28,'1型糖尿病','显著好转'],

'004':['马化腾',52,'2型糖尿病','较差'] }

print(patientDic2)

# In[16]:

valueList1 = patientDic2['001']

print(valueList1)

# In[17]:

print('修改之前,病人信息：',patientDic2['001'])

patientDic2['001']=['猴子',29,'1型糖尿病','好转']

print('修改之后,病人信息：',patientDic2['001'])

# # 条件判断

# In[20]:

# 《摔跤吧，爸爸》豆瓣评分

scoreNum =9.1

if scoreNum >=8:

print('我要去看这部电影')

else:

print('电影太烂，不去看了')

# 我要去看这部电影

##条件判断的一般格式

# if 边界条件：

#缩进要做的事情1

# eles:

#缩进要做的事情2

# # 条件判断：边界条件

# ## 1、值比较大于小于大于等于小于等于不等于等于

# ## 2、逻辑比较并且或者不是

# In[22]:

#定义列表：病人姓名

nameList = ['猴子','马云','王健林','马化腾']

if '猴子' not in nameList:

print('列表中没有叫猴子的病人')

else:

print('列表中有个叫猴子的人')

# # 多个条件判断

# ## if # 边界条件1：

# ## 缩进要做的事情1

# ## elif 边界条件2：

# ## 缩进要做的事情2

# ## else：

# ## 缩进要做的事情3

# In[33]:

age=int(input('请输入你家狗狗的年龄，按enter键获取计算结果:'))

if age< 0:

print('狗狗年龄不能小于0')

elif age == 1:

print('相当于14岁的人')

elif age == 2:

print('相当于22岁的人')

else:

human = 22+(age-2)*4

print ('对应人类年龄：',human)

# # 循环批量处理数据

# ##for i in 容器：

# ##要做的事情

# In[31]:

# 重复性工作

print('吃第1次饭')

print('吃第2次饭')

print('吃第3次饭')

# 容器：1天中吃第几次饭

eatList= ['吃第1次饭','吃第2次饭','吃第3次饭']

#循环

for i in eatList:

print(i)

# In[43]:

'''

定义字典:6家公司(GAFATA)的股票

key是公司名称，value是股票代码

'''

gafataDict = {'腾讯':'HK:00700','阿里巴巴':'baba','苹果':'Apple',

'谷歌':'：GOOGLE','Facebook':'fb','亚马逊':'amzn'}

#将股票代码全部大写

for key,value in gafataDict.items():

# 将股票代码转换成大写

newValue = value.upper()

#将转换后的新股票代码直接赋值给对应的key

gafataDict[key]=newValue

print(gafataDict)

# In[52]:

for key,value in gafataDict.items():

if (key== '苹果'):

continue

print('当前公司:',key,'当前股票代码:',value)

# In[56]:

number = 0

for key,value in gafataDict.items():

number = number + 1

if(key =='苹果'):

print('查找',key,'公司的股票代码是',value)

break

print('当前公司:',key,',当前股票代码：',value)

# In[61]:

'''

定义函数

函数功能：两个数相加

输入：x ，y是要相加的两个数

输出：两个数相加的和

'''

# In[2]:

#定义函：改变例表的值

def changeList(inputList):

inputList.append('奶茶妹妹')

'''

使用函数

参数是可变数据类型：

传递的是该变量的引用地址

'''

nameList = ['马云','刘强东']

print('调用函数之前的值:',nameList)

changeList(inputList= nameList)

print('调用函数之后的值:',nameList)

# In[4]:

#变量作用域

def test():

aStr= '别理会他人闲言碎语，今日随他们，让他们说吧，你的机会将会到来，再来证明自己。'

# 在函数外面，访问函数内的局部变量aStr

print(aStr)

# # 如何使用python内置模块

# In[5]:

'''

python内置模块

'''

# 第1步：引入模块

import sys

#第2步：使用模块中的函数，属性

pathList = sys.path

print ('python 路径为：\n',pathList)

# In[18]:

import pandas as pd

fileNameStr=r"C:\Users\tomgs\Desktop\病历数据.xlsx"

xl = pd.ExcelFile(fileNameStr)

patientDf = xl.parse('Sheet1')

print(patientDf)

# # 数据结构集合

# ## 双向链表 queue

# ## 排序字典 OrderedDict

# ## 计数器 Counter

# In[13]:

# 定义队列：排队吃

from collections import deque

queue=deque(['001','002','003','04','005'])

queue.append('006')

print(queue)

# In[15]:

# 定义栈：浏览我个人知乎主页的顺序

stack = deque(['知乎动态','知乎回答','知乎文章'])

#入栈：在栈顶加入元素

stack.appendleft('知乎专栏')

print (stack)

# In[16]:

stack.pop()

print(stack)

# # python默认的字典

# In[20]:

#6家公司名称及股票代码

gafataDict = {'腾讯':'HK:00700','阿里巴巴':'baba','苹果':'Apple',

'谷歌':'：GOOGLE','Facebook':'fb','亚马逊':'amzn'}

# In[22]:

gafataDict

# # collention 中排序字典

# In[23]:

'''

0rderedDict:按照插入Key的顺序，对字典排序

'''

from collections import OrderedDict

#定义有序字典

gafataOdDict=OrderedDict({'腾讯':'HK:00700','阿里巴巴':'baba','苹果':'Apple',

'谷歌':'：GOOGLE','Facebook':'fb','亚马逊':'amz

五、代码练习中的感受

1、python学习过程中要多敲代码，多练习才能对各种基本的规则了解，熟悉。

2、要善于使用工具，方便学习。我这里主要安装了能够简化代码的变量。安装了一个有道词典的小工具，当错误提示出来的时候，可以通过实时翻译查找错误原因。

weixin_39959349

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大数据的python基础_大数据量化之路之python基础

一、计算机运行基本原理及python基础在了解计算机运行基本原理之上，理解python程序运行基本原理。做好数据分析准备工作。安装好Anaconda做好相应变量配置，下载cmd工具Conemu，利用Anaconda工具安装配置好jupyternotebook。二、jupyternotebook上的代码示例打开conemu，输入命令 conda env list 查看所创建的虚拟环境，选择第二个虚拟...
复制链接

扫一扫