python模块
Regent Wan
这个作者很懒,什么都没留下…
展开
-
pip命令以及常用镜像源
pip是python包管理工具,提供了对python包的下载、安装、卸载等功能。python安装包自带该工具,无需单独安装。可以通过如下命令查看pip版本:pip --version若未安装,可以通过如下命令安装原创 2020-12-07 18:18:21 · 32493 阅读 · 0 评论 -
python中list的用法
向空list中添加元素:list=[x]向list中追加元素:list.append(x),此种方式会改变list,返回值为None判断list是否为空:if list判断list是否非空:if not list判断list中是否存在元素:x in list原创 2020-08-28 14:25:32 · 2263 阅读 · 0 评论 -
python模块专题——10.lxml
lxml库用于在html字符串中使用xpath语言提取标签属性和内容等。1 安装pip install lxml2 使用from lxml import etreeele=etree.HTML("html字符串")result=ele.xpath("xpath语法串")对于list形式的元素,有两种提取方式每次提取某个属性的所有值先得到list,再每次获取单个对象的所有属性值。此时需要用./表名路径3 示例爬取豆瓣电影排行榜import requestsimport js原创 2020-07-26 20:47:18 · 1343 阅读 · 0 评论 -
python模块专题——9.json
json模块是python内置模块,无需安装。用于json格式的数据处理,json字符串与json对象相互转换。1 使用import jsonjson.loads(str)json.dumps(json)2 解析将json字符串转为json对象:json.loads(str)将json对象转为json字符串:json.dumps(json,ensure_ascii=False,indent=2)ensure_ascii参数设置为false,保存到文件中时就不会把中文转为asci原创 2020-07-26 20:44:07 · 1322 阅读 · 0 评论 -
python模块专题——8.retrying
retrying用于程序在访问时可能会偶尔出现错误,并需要重新执行的场景,如爬虫。1 安装pip install retrying2 使用可以指定函数出错的最大次数,被装饰函数反复执行全部出错才会出错,若有一次不出错则返回使用方法from retrying import retry@retry(stop_max_attempt_number=3)def fun(): passNotice应博友的要求,创建了一个QQ群,方便大家学习交流,群内也会经常分享一下学习资原创 2020-07-26 20:36:39 · 1249 阅读 · 0 评论 -
python模块专题——7.requests
requests用于仿照客户端向服务器发送请求,并对响应进行处理的第三方库。1 安装pip install requests2 使用import requestsre=requests.get('http://www.baidu.com')print(re.status_code)re.encoding='utf-8'print(re.text)3 解析requests.get(url,headers=headers,timeout)向url服务器发出get请求,并返回响原创 2020-07-25 23:04:39 · 1324 阅读 · 0 评论 -
python模块专题——6.pandas
pandas库用于矩阵运算1.简介Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。主要提供Series和DataFrame这两种数据结构及其系列操作,2.Series 它是一种类似于一维数组的对象,是由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数据也可产生简单的Series对象。2.1 创建Series类似一维数组,是一种带有索引的序列。可以通过列表原创 2020-07-25 22:21:48 · 1349 阅读 · 0 评论 -
python模块专题——5.numpy
numpy用于数值计算。1.简介Numpy提供了一个在Python中做科学计算的基础库,重在数值计算,主要用于处理多维数组(矩阵)的库。用来存储和处理大型矩阵,比Python自身的嵌套列表结构要高效的多。本身是由C语言开发,是个很基础的扩展,Python其余的科学计算扩展大部分都是以此为基础。高性能科学计算和数据分析的基础包ndarray,多维数组(矩阵),具有矢量运算能力,快速、节省空间矩阵运算,无需循环,可完成类似Matlab中的矢量运算线性代数、随机数生成2.安装与使用已有发行原创 2020-07-24 14:32:29 · 2919 阅读 · 0 评论 -
python模块专题——4.matplotlib
matplotlib用于数据可视化,熟悉matlab的朋友对他应该不会陌生。1.简介数据的处理、分析和可视化已经成为Python近年来最为重要的应用领域之一,其中数据的可视化指的是将数据呈现为漂亮的统计图表,然后进一步发现数据中包含的规律以及隐藏的信息。2.安装与使用安装:使用pip命令进行安装:pip install matplotlib使用from matplotlib import pyplot as pltx=[x for x in range(1,10)]y=[i**2原创 2020-07-24 14:15:34 · 1409 阅读 · 0 评论 -
python模块专题——3.wordcloud
wordcloud库用于词云绘制。1.介绍词云又叫文字云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思。2.安装与使用pip install wordcloudpython开发环境、jieba、matplotlib、numpy 、PIL 等库文件安装好。wordcloud.WordCloud()代表一个对应的词云对象根据文本中词语出现的频率等参数绘制词云绘制词云的形状、尺寸原创 2020-07-24 13:07:38 · 1367 阅读 · 0 评论 -
python模块专题——2.jieba
jieba库用于中文分词处理。1.特点支持三种分词模式:精确模式:试图将句子最精确地切开,不存在冗余单词,适合文本分析;全模式:把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;搜索引擎模式:在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。支持繁体分词支持自定义词典MIT 授权协议2.安装与使用全自动安装:easy_install jieba 或者 pip install jieba / pip3 install jieba半自动原创 2020-08-17 16:43:40 · 2179 阅读 · 0 评论 -
python模块专题——1.faker
Python 中有个测试数据库,叫做 Faker,它可以自动帮我们来生成各种各样的看起来很真的”假“数据1 安装pip install faker2 使用from faker import Fakerfaker=Faker()print('name:',faker.name())print('address:',faker.address())print('text:',faker.text())'''name: Steve Thomasaddress: 10082 Hall M原创 2020-07-22 15:40:15 · 6654 阅读 · 0 评论