上一篇文章:计算机要点概述+交互方式+基本的dos命令+文本文件和字符集+进制转换+环境变量
Python要点及其环境搭建+Pycharm简单使用教程
Python语言概述
- Python 是一种极少数能兼具简单与功能强大的编程语言。你将惊异于发现你正在使用的这门编程语言是如此简单,它专注于如何解决问题,而非拘泥于语法与结构
- 官方对Python的介绍:Python 是一款易于学习且功能强大的编程语言。 它具有高效率的数据结构,能够简单又有效地实现面向对象编程。Python 简洁的语法与动态输入之特性,加之其解释性语言的本质,使得它成为一种在多种领域与绝大多数平台都能进行脚本编写与应用快速开发工作的理想语言
- Python 的创造者Guido van Rossum采用 BBC 电视节目《蒙提·派森的飞行马戏团(Monty Python’s Flying Circus,一译巨蟒剧团)》的名字来为这门编程语言命名
- Python 的特色
• 简单
• 易于学习
• 自由且开放
• 跨平台
• 可嵌入性
• 丰富的库 - Python的应用
• 常规软件开发
• 科学计算
• 自动化运维
• 自动化测试
• WEB开发
• 网络爬虫
• 数据分析
• 人工智能 - Python之禅
(输入 import this)
美胜于丑陋(Python 以编写优美的代码为目标)
明了胜于晦涩(优美的代码应当是明了的,命名规范,风格相似)
简洁胜于复杂(优美的代码应当是简洁的,不要有复杂的内部实现)
复杂胜于凌乱(如果复杂不可避免,那代码间也不能有难懂的关系,要保持接口简洁)
扁平胜于嵌套(优美的代码应当是扁平的,不能有太多的嵌套)
间隔胜于紧凑(优美的代码有适当的间隔,不要奢望一行代码解决问题)
可读性很重要(优美的代码是可读的)
即便假借特例的实用性之名,也不可违背这些规则(这些规则至高无上)
不要包容所有错误,除非你确定需要这样做(精准地捕获异常,不写 except:pass 风格的代码)
当存在多种可能,不要尝试去猜测而是尽量找一种,最好是唯一一种明显的解决方案(如果不确定,就用穷举法)
虽然这并不容易,因为你不是 Python 之父(这里的 Dutch 是指 Guido )
做也许好过不做,但不假思索就动手还不如不做(动手之前要细思量)
如果你无法向人描述你的方案,那肯定不是一个好方案;反之亦然(方案测评标准)
命名空间是一种绝妙的理念,我们应当多加利用(倡导与号召)
Python环境搭建
- Python的解释器
• 环境搭建就是安装Python的解释器
• •Python的解释器分类:
• •CPython(官方我们用的就是这个版本) 用c语言编写的Python解释器
• •PyPy 用Python语言编写的Python解释器
• •JPython 用Java编写的Python解释器 - 进入Python官网下载
点击Windows
添加到环境变量打勾,并选择自定义安装
安装完成
pip工具的使用
- pip介绍
-
- 我们都知道python有很多的第三方库或者说是模块。这些库针对不同的应用,发挥不同的作用。我们在实际的项目中肯定会用到这些模块。那如何将这些模块导入到自己的项目中呢?
-
- Python官方的PyPi仓库为我们提供了一个统一的代码托管仓库,所有的第三方库,甚至你自己写的开源模块,都可以发布到这里,让全世界的人分享下载 。
-
- python有两个著名的包管理工具easy_install和pip。在python 2中easy_install是默认安装的,而pip需要我们手动安装。随着Python版本的提高,easy_install已经逐渐被淘汰,但是一些比较老的第三方库,在现在仍然只能通过easy_install进行安装。目前,pip已经成为主流的安装工具,自Python 2 >=2.7.9或者Python 3.4以后默认都安装有pip
- 在命令行下,输入pip,回车可以看到帮助说明:
- 查看pip版本
命令行下输入:pip -V
敲回车
- 更新pip的版本
命令行下输入:
python -m pip install --upgrade pip
如果安装失败,多安装几次就可以了,因为是国外的网站,所以下载速度很慢
安装成功:
- 使用pip安装第三方模块
比如:pip install requests
如果安装失败多尝试几次就可以了
安装成功:
- 指定版本安装:
例如:pip install robotframework==2.8.7
pip install SomePackage
pip install SomePackage==1.0.5
指定版本
pip install 'SomePackage>=1.0.6'
最小版本
升级指定的包,通过使用==, >=, <=, >, < 来指定一个版本号。
- 卸载已安装的库
例如:pip uninstall requests
- 列出已安装的库:
pip list
- 显示安装包的信息
pip show package
pip show -f package
显示具体的一些文件
- 将已安装的库列表保存到文本文件中
要先在指定路径中创建一个文本文件,然后按图示操作:
pip freeze > 文件路径
pip list > 文件路径
- 依次读取文本文件中的模块,然后一次性安装文本文件中的所有模块
首先,文本文件中需要有要安装的模块的名字,然后:
pip install -r 文件路径
- 指定库的更新
pip install -U package
PyCharm的安装和配置
官网下载
左边专业版(付费的,可以免费试用),右边社区版,Download下载完成后安装
Next,选择安装位置:
下一步:
64位的(电脑是多少位的就安装多少位的)
添加到PATH环境变量
将文件夹作为项目打开
最后一个可打勾也可不打勾,建议不打勾,如果打勾了,以后所有的后缀为.py的文件都会用Pycharm打开
Install就行了
Finish完成
PyCharm的简单配置
- 1、主题修改 File–settings–apperance–theme
- 2、代码字体修改 File–settings–Editor-Font
- 3、关闭更新 File–settings—apperance—System Settings —Updates — Automatically check updates for 取消打钩
- 4、快捷键修改 File–settings—apperance-- Keymap 选择自己习惯的快捷键方式
- 5、自动导包 File–settings—apperance–General —Auto Import 打钩
- 6、进制打开上次的工程 File–settings—apperance—System Settings —Reopen last project startup
- 7、修改新建文件文件头 File–settings–Editor—Code Style — File and Code Templates — Python Script
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : ${DATE} ${TIME}
# @Author : JackeySong
# @File : ${NAME}.py
# @Software: ${PRODUCT_NAME}
- 8、修改字体编码 File–settings–Editor—Code Style — File Encoding — Project Encoding
使用Pycharm编程
打开Pycharm:
- “New Project”新建项目
- “open”打开一个项目
- “Get from VCS”导入别人的项目
点击“New Project”
- Location后面的是新创建项目的文件保存位置
- Python Interpreter: New Virtualenv environment后面有两个选项:
-
- 选项一:New environment using是一个虚拟环境
-
- 选项二:Previously configured interpreter先前配置的解释器,因为是新安装的,所以没有先前配置的解释器
- 选项一中Loacation文件路径,base interpreter是我们要用到的解释器,是之前安装好的python版本
- 选项一中又有两个要勾选的选项:
如果选中了第一个表示我们在这个虚拟环境中可以使用第三方库,如果不选则与外界隔离;所以这个一定要勾选
第二个意思是这个虚拟环境是否提供给其他项目使用,既然是在虚拟环境中,建议不用点勾了,因为虚拟环境是自己独立的一个环境,与其他环境是毫无相关的
点击Create按钮创建即可
刚进入时的这个界面是一些技巧直接close,或者说Next tip
打印第一个hello world
绿色三角号运行,下面是运行结果
使用Pycharm实现一个最简单的爬虫
代码如下,我自己对代码进行了注释,前面加入了笔记
"""
爬虫:从网站/APP 抓取数据的一个自动化程序 自动化:代替人工操作 抓取数据:获取数据
百度--输入关键字--搜索--------爬虫(百度,谷歌)
从互联网抓取到与关键字有关 的信息,展现再面前
爬虫存在的意义:
1.节省人力,物力资源,提高效率
2.抓取大量数据
爬虫 网站 抓取数据
蜘蛛 蜘蛛网 捕食
python抓取静态网站内容
网站组成:前端(页面美观性)+后端(功能实现,性能优化)
网站分类:
静态网站:所需要的数据在源代码中间能够获取到
动态网站:80% 微博 ajax异步数据加载
Python后端语言,胶水语言
优点:
1.代码少
2.第三方库直接使用
3.开发效率高
4.应用方向多
....
string字符串----encode编码----bytes字节类型
bytes字节类型----decode解码----string字符串类型
正则:表达某种内容的共同属性,共同特征 正则符:.*匹配任意字符
内容:表达共同属性,共同的规律
通过一行代码抓取到大量数据
range函数:生成整数数列,只有一个参数时,默认从零开始;含头不含尾
for in:循环 遍历
字符串格式化:占位符
%s字符串 包含%d
%d数字
{}.format()
"""
'''
步骤:倒推法 面对一个问题,有一个结果:比如电商销量不好,业绩不好 步骤:浏览数(曝光) 购买数 客服 咨询数....
1.源代码从哪里找到?----对网址发送请求
2.案例介绍的数据从哪里来呢?----从源代码找到数据
3.目的:抓取案列 介绍数据
'''
#爬虫:第三方库 框架 解析方式
#urllib re requsts bs4 pyquery scrapy scrapy-redis pyspider selenium....
import urllib.request#自带模块
import re
#1.对网址发送请求,获取数据代码
def getdate():#自定义函数 内置函数:打印输出print
for i in range(26700, 26730):
url = ''#这个单引号里面要输入你想要爬取的网站
html = urllib.request.urlopen(url).read()#urlopen打开网址 read读取代码
html = html.decode('utf-8')#解码 编码问题
print(html)
#2.从源代码获取数据 .*匹配任意字符
re1 = '<div class="sc_d_c">(.*)<span class="sc_d_con">(.*)</span></div>'
page_list = re.findall(re1, html)
print(page_list)
#自定义函数必须要调用,否则没有任何结果出现
getdate()
创建新项目并配置本地解释器
当我们想要创建新项目的时候:
点击file
点击New Project:
如果不用虚拟环境,我们就用Previously configured interpreter,由于之前从来没有配置过本地的解释器,所以要配置一下:
配置完成后:
就可以使用本地的解释器了
如何关闭项目:
file-----close project
使用Pycharm导入别人的项目
选择Get from VCS
可以选择从Git导入,也可以选择其他两个,通常使用Git,需要先下载Git,点击蓝字Download and Install,安装完成后:
然后配置Git:file-----settings:
找到并选择安装的Git文件路径:
点击测试test:然后显示了Git的版本信息,表明配置成功
打开Git的官网
如果没有Git的账户可以先创建一个Git账号,sign up创建账号,创建完成后sign in登录
然后搜索输入:以requests为例
这个是别人写好的开源代码,点击Code
复制网址,然后打开pycharm:URL输入网址
点击Clone(克隆)
这样就可以导入别人的项目了,这里只是个示例。