大数据的python基础_大数据量化之路之python基础

一、计算机运行基本原理及python基础

在了解计算机运行基本原理之上,理解python程序运行基本原理。做好数据分析准备工作。

安装好Anaconda做好相应变量配置,下载cmd工具Conemu,利用Anaconda工具安装配置好jupyternotebook。

二、jupyternotebook上的代码示例

打开conemu,输入命令 conda env list 查看所创建的虚拟环境,选择第二个虚拟环境,打开jupyternotebook进行代码练习。

打开jupyternotebook如下图:

建立了以python3为基础的代码练习,点击左上角的File可以对文件进行保存,输出为各种格式。按Run为运行(或者ctrl+Enter)命令,code为代码输出。

三、python脚本常用结构

四、代码练习实例

#!/usr/bin/env python

# coding: utf-8

# In[1]:

print("hello world")

# In[2]:

name = 'python3:猴子数据分析社群'

# In[3]:

name

# # 如何盖房子

#

# ## 第1步 房子设计

#

# ## 第2步 地基(数据分析运行环境)

#

# ## 第3步 准备材料(数据)

#

# ## 第4步 组合材料(函数,条件判断,循环)

# In[4]:

nameStr = '马云'

nameStr2 = '有钱'

print(nameStr + nameStr2)

# In[66]:

str1 = '我叫%s ,俺爹是 %s' % ('王思聪','王健林')

print(str1)

# In[ ]:

# In[11]:

age = 50

# In[13]:

money = 3.53

# In[16]:

namelist = ['猴子','马云','王健林','马化腾']

namelist

# In[19]:

namelen = len(namelist)

print('列表长度:病人数目:',namelen)

# In[23]:

namelist.append('刘强东')

print('增加一个元素:',namelist)

# In[24]:

del namelist[1]

print(namelist)

# In[26]:

name1 = namelist[0]

print (name1)

# In[27]:

print(namelist[0])

namelist[0] = '孙悟空'

print(namelist[0])

# In[29]:

gafataTuple = ('腾讯','阿里巴巴','苹果','谷歌','Facebook','亚马逊')

gafatalen=len(gafataTuple)

print(gafatalen)

print(gafataTuple[0])

# In[30]:

gafatasets= {'腾讯','阿里巴巴','苹果','谷歌','Facebook','亚马逊','亚马逊'} # 容器,集合(sets)是一个没有重复元素的容器

print(gafatasets)

# In[32]:

stocksets = set()

stocksets.update(['腾讯','阿里巴巴','京东'])

print(stocksets)

# In[34]:

stocksets.discard('京东')

print(stocksets)

# In[35]:

txBOOL = '腾讯' in stocksets

print(txBOOL)

# In[36]:

stocksets.discard('京东')

stocksets.update(['京东'])

print(stocksets)

# In[15]:

patientDic2 ={'001':['猴子',29,'1型糖尿病','较差'],

'002':['马云',34,'2型糖尿病','好转'],

'003':['王健林',28,'1型糖尿病','显著好转'],

'004':['马化腾',52,'2型糖尿病','较差'] }

print(patientDic2)

# In[16]:

valueList1 = patientDic2['001']

print(valueList1)

# In[17]:

print('修改之前,病人信息:',patientDic2['001'])

patientDic2['001']=['猴子',29,'1型糖尿病','好转']

print('修改之后,病人信息:',patientDic2['001'])

# # 条件判断

# In[20]:

# 《摔跤吧,爸爸》豆瓣评分

scoreNum =9.1

if scoreNum >=8:

print('我要去看这部电影')

else:

print('电影太烂,不去看了')

# 我要去看这部电影

##条件判断的一般格式

# if 边界条件:

#缩进 要做的事情1

# eles:

#缩进 要做的事情2

# # 条件判断:边界条件

#

# ## 1、值比较 大于 小于 大于等于 小于等于 不等于 等于

# ## 2、逻辑比较 并且 或者 不是

# In[22]:

#定义列表:病人姓名

nameList = ['猴子','马云','王健林','马化腾']

if '猴子' not in nameList:

print('列表中没有叫猴子的病人')

else:

print('列表中有个叫猴子的人')

# # 多个条件判断

#

# ## if # 边界条件1:

#

# ## 缩进 要做的事情1

#

# ## elif 边界条件2:

#

# ## 缩进 要做的事情2

#

# ## else:

#

# ## 缩进 要做的事情3

#

# In[33]:

age=int(input('请输入你家狗狗的年龄,按enter键获取计算结果:'))

if age< 0:

print('狗狗年龄不能小于0')

elif age == 1:

print('相当于14岁的人')

elif age == 2:

print('相当于22岁的人')

else:

human = 22+(age-2)*4

print ('对应人类年龄:',human)

# # 循环批量处理数据

# ##for i in 容器:

# ##要做的事情

# In[31]:

# 重复性工作

print('吃第1次饭')

print('吃第2次饭')

print('吃第3次饭')

# 容器:1天中吃第几次饭

eatList= ['吃第1次饭','吃第2次饭','吃第3次饭']

#循环

for i in eatList:

print(i)

# In[43]:

'''

定义字典:6家公司(GAFATA)的股票

key是公司名称,value是股票代码

'''

gafataDict = {'腾讯':'HK:00700','阿里巴巴':'baba','苹果':'Apple',

'谷歌':':GOOGLE','Facebook':'fb','亚马逊':'amzn'}

#将股票代码全部大写

for key,value in gafataDict.items():

# 将股票代码转换成大写

newValue = value.upper()

#将转换后的新股票代码直接赋值给对应的key

gafataDict[key]=newValue

print(gafataDict)

# In[52]:

for key,value in gafataDict.items():

if (key== '苹果'):

continue

print('当前公司:',key,'当前股票代码:',value)

# In[56]:

number = 0

for key,value in gafataDict.items():

number = number + 1

if(key =='苹果'):

print('查找',key,'公司的股票代码是',value)

break

print('当前公司:',key,',当前股票代码:',value)

# In[61]:

'''

定义函数

函数功能:两个数相加

输入:x ,y是要相加的两个数

输出:两个数相加的和

'''

# In[2]:

#定义函:改变例表的值

def changeList(inputList):

inputList.append('奶茶妹妹')

'''

使用函数

参数是可变数据类型:

传递的是该变量的引用地址

'''

nameList = ['马云','刘强东']

print('调用函数之前的值:',nameList)

changeList(inputList= nameList)

print('调用函数之后的值:',nameList)

# In[4]:

#变量作用域

def test():

aStr= '别理会他人闲言碎语,今日随他们,让他们说吧,你的机会将会到来,再来证明自己。'

# 在函数外面,访问函数内的局部变量aStr

print(aStr)

# # 如何使用python内置模块

# In[5]:

'''

python内置模块

'''

# 第1步:引入模块

import sys

#第2步:使用模块中的函数,属性

pathList = sys.path

print ('python 路径为:\n',pathList)

# In[18]:

import pandas as pd

fileNameStr=r"C:\Users\tomgs\Desktop\病历数据.xlsx"

xl = pd.ExcelFile(fileNameStr)

patientDf = xl.parse('Sheet1')

print(patientDf)

# # 数据结构 集合

# ## 双向链表 queue

# ## 排序字典 OrderedDict

# ## 计数器 Counter

# In[13]:

# 定义队列:排队吃

from collections import deque

queue=deque(['001','002','003','04','005'])

queue.append('006')

print(queue)

# In[15]:

# 定义栈:浏览我个人知乎主页的顺序

stack = deque(['知乎动态','知乎回答','知乎文章'])

#入栈:在栈顶加入元素

stack.appendleft('知乎专栏')

print (stack)

# In[16]:

stack.pop()

print(stack)

# # python默认的字典

# In[20]:

#6家公司名称及股票代码

gafataDict = {'腾讯':'HK:00700','阿里巴巴':'baba','苹果':'Apple',

'谷歌':':GOOGLE','Facebook':'fb','亚马逊':'amzn'}

# In[22]:

gafataDict

# # collention 中排序字典

# In[23]:

'''

0rderedDict:按照插入Key的顺序,对字典排序

'''

from collections import OrderedDict

#定义有序字典

gafataOdDict=OrderedDict({'腾讯':'HK:00700','阿里巴巴':'baba','苹果':'Apple',

'谷歌':':GOOGLE','Facebook':'fb','亚马逊':'amz

五、代码练习中的感受

1、python学习过程中要多敲代码,多练习才能对各种基本的规则了解,熟悉。

2、要善于使用工具,方便学习。我这里主要安装了能够简化代码的变量。安装了一个有道词典的小工具,当错误提示出来的时候,可以通过实时翻译查找错误原因。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值