Python
#全家桶
这个作者很懒,什么都没留下…
展开
-
Python—实训day12—汽车用户消费投诉案例-分析及可视化
1数据预处理1.1读取数据,查看数据形状,数据类型 #------------1.1读取数据,查看数据形状,数据类型-------------------- import pandas as pd data = pd.read_excel(r'F:\Desktop\汽车用户消费投诉数据.xlsx') data.head() data_shape = data.shape #(75423, 8) data.dtypes #查看数据类型 1.2检原创 2020-10-01 15:50:08 · 728 阅读 · 1 评论 -
Python—实训day11—Pyecharts绘图
1绘图逻辑(1)选择图表类型;(2)添加数据;(3)设置全局变量;(4)显示及保存图表。1.1图表类型from pyecharts.charts import *1.2添加数据散点图、折线图等二维数据图形可通过 .add_xaxis(xaxis_data=x)和.add_yaxis(series_name='', y_axis=y)方法设置。饼图等一维图形可通过.add(series_name=‘’, data_pair=[(i, j)for i, j in zip(原创 2020-10-01 15:48:41 · 2619 阅读 · 0 评论 -
Python—实训day10—Matplotlib数据可视化和scikit-learn构建模型
1.Matplotlib数据可视化基础 import matplotlib.pyplot as plt import numpy as np plt.rcParams['font.sans-serif'] = 'SimHei' #------------1散点图scatter x = np.arange(0, 1, 0.05) y = x**2 y1 = x**4 #散点图 plt.scatter(x, y) plt.show原创 2020-09-27 16:54:22 · 402 阅读 · 0 评论 -
Python—实训day9—使用pandas进行数据预处理
1合并数据1.1堆叠合并数据1.1.1横向堆叠(行对齐,左右拼接)横向堆叠,即将两个表在X轴向拼接在一起,可以使用concat函数完成,concat函数的基本语法如下。pandas.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, copy=True)常用参数如下所示。原创 2020-09-25 20:48:16 · 1351 阅读 · 0 评论 -
Python—实训day8—掌握DataFrame的常用操作
2掌握DataFrame的常用操作2.1基础属性detail.columns #列名detail.index #索引/行名detail.shape #形状detail.dtypes #类型2.2查改增删DataFrame数据2.2.1查看访问DataFrame中的数据(1)对单列数据的访问DataFrame的单列数据为一个Series。根据DataFrame的定义可以知晓DataFrame是一个带有标签的二维数组,每个标签相当每一列的列名。有以下两种方式来实现对单列数原创 2020-09-25 20:47:22 · 1942 阅读 · 0 评论 -
Python—实训day7下—Pandas统计分析基础
1读写不同数据源的数据1.1读写文本文件1.1.1文件读取文本文件(txt文件)是一种由若干行字符构成的计算机文件,它是一种典型的顺序文件。使用read_table来读取文本文件:pandas.read_table(filepath_or_buffer, sep=’\t’, header=’infer’, names=None, index_col=None, dtype=None, engine=None, nrows=None)csv是一种逗号分隔的文件格式,因为其分隔符不一定是逗原创 2020-09-23 20:24:53 · 598 阅读 · 0 评论 -
Python—实训day7上—Nmupy数值计算基础
Numpy是用于数据科学计算的基础模块,不但能够完成科学计算的任务,而且能够被用作高效的多维数据容器,可用作存储和处理大型矩阵,它的运算速度会比Python自带的列表运算速度要快。Numpy的数据容器可用来存储多种类型数据,这使得Numpy可以快速并且无缝整合各种类型数据。Numpy本身并没有提供很多高级的数据分析功能,理解Numpy数组及数组计算有助于更加高效地使用诸如pandas等数据处理工具。1掌握Numpy数组对象ndarrayndarray(数组)是存储单一数据类型的多维数组。1.1创原创 2020-09-23 20:21:07 · 214 阅读 · 0 评论 -
Python—实训day6—爬取汽车消费投诉案例
任务:爬取某公开网站上的汽车用户消费投诉数据('http://tousu.315che.com/tousulist/serial/55467/'),字段包含品牌、投诉内容、品牌车型、单号、投诉问题、投诉时间和经销商,并为完成后续项目做准备。# 导入相应库import requestsfrom lxml import etreeurl = 'http://tousu.315che.com/tousulist/serial/55467/' # 第一页的网页链接# 发送请求req = re原创 2020-09-22 16:11:26 · 428 阅读 · 3 评论 -
Phython—实训day5—爬虫相关知识
1爬虫练习(urllib+xpath)爬取某公司官网新闻中心板块(“http://www.tipdm.com/xwzx/index.jhtml”)中的新闻标题和新闻内容,爬取页数为5页。要求:使用urllib库实现HTTP请求的发送,使用Xpath进行网页解析,最后将爬取到的内容保存至Excel文件中。1.1第一页数据的爬取#导入相应库from urllib import requestfrom lxml import etreeimport pandas as pd #安装命令:pi.原创 2020-09-22 08:29:17 · 687 阅读 · 0 评论 -
Python—实训day4—爬虫案例3:贴吧图片下载
6 xpath首先需要安装Google的Chrome浏览器6.1 安装xpath插件把 xpath_helper_2_0_2.crx 修改后缀名为 xpath_helper_2_0_2.rar。并解压在Chrome浏览器中,访问 chrome://extensions/ 。打开开发者模式(把开关推动到右边)点击“加载已解压的扩展程序”选择 解压后的 xpath_helper_2_0_2 目录安装后,留意右上角这个,就是xpath插件访问任意其他页面,比如w原创 2020-09-17 15:46:19 · 207 阅读 · 0 评论 -
Python—实训day3—简单的在线翻译程序
4 发送POST请求4.3 用poster获取有道在线翻译参考有道翻译:http://fanyi.youdao.com/通过Fiddler工具可以获取到请求的URL地址为:http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule提交的请求体参数 i=hello from=AUTO to=AUTO smartresult=dict client=fanyide原创 2020-09-16 16:44:37 · 290 阅读 · 0 评论 -
Python—实训day2—爬虫案例1:访问百度贴吧
2 爬虫案例1:访问百度贴吧假设我们要访问的贴吧是:动漫吧头几页的URL地址为:https://tieba.baidu.com/f?kw=%E5%8A%A8%E6%BC%AB&ie=utf-8&pn=0https://tieba.baidu.com/f?kw=%E5%8A%A8%E6%BC%AB&ie=utf-8&pn=50https://tieba.baidu.com/f?kw=%E5%8A%A8%E6%BC%AB&ie=utf-8&pn原创 2020-09-15 16:10:06 · 265 阅读 · 0 评论 -
Python—实训day1—语法
1 Python基础语法简介1.1 每行的最后一个字符C/C++/Java中每行的最后都需要加上分号Python中每行的最后都不需要加上分号1.2 数据类型C语言中的数据类型:short、int、longfloat、doublechar*、[ ]struct、unionJava中的数据类型:byte、short、int、longfloat、doublecharbooleanclass、[ ] (引用类型)Python中的数据类型:数值n原创 2020-09-15 14:58:28 · 132 阅读 · 0 评论