chaser&upper
西电CS硕士在读,热爱Coding,喜欢分享,欢迎您与我交流~
展开
-
【数据挖掘】期末复习模拟题(暨考试题)
Python数据挖掘Python数据挖掘单选题多选题判断题程序填空程序分析Python数据挖掘单选题什么是KDD ( ) ?A、数据挖掘与知识发现 B、领域知识发现C、文档知识发现 D、态知识发现人从出生到长大的过程中,是如何认识事物的()?A、聚类过程 B、分类过程C、先分类,后聚类 D、先聚类,后分类“8,000米是飞机飞行最大高度”与“10,000米的高山”表示:( )。A、数据 B、信息C、知识 D、智慧“8,000”和“10,000”表示:( ) 。A原创 2021-12-23 18:23:55 · 10721 阅读 · 2 评论 -
【Python数据分析与可视化】期末复习试题集
1.Jupyter notebook不具备的功能是 ()Jupyter notebook可以直接生成一份交互式文档Jupyter notebook可以安装Python库Jupyter notebook可以导出HTML文件Jupyter notebook可以将文件分享给他人right_answers: Jupyter notebook可以将文件分享给他人2.在Jupyter notebook的命令模式下,要查看所有快捷..原创 2021-12-03 22:21:22 · 22681 阅读 · 23 评论 -
【宝藏级】PyEcharts 超详细的使用指南
Python可视化神器-pyecharts手册pyecharts简介优点:安装:官方文档:pyecharts快速开始在`Notebook`中创建一个条形图:链式调用:配置选项:全局配置项`AnimationOpts`:画图动画配置项`InitOpts`:初始化配置项`ToolBoxFeatureOpts`和`ToolboxOpts`:工具箱配置项`TitleOpts`:标题配置项`DataZoomOpts`:区域缩放配置项`LegendOpts`:图例配置项`VisualMapOpts`:视觉映射配置项`T原创 2021-11-12 21:44:54 · 31344 阅读 · 26 评论 -
【宝藏级】全网最全的Pandas详细教程(2万字总结)
【回炉重造】Python之Pandas详细教程前言为什么要学习pandas?什么是Pandas?官网1. Pandas的索引操作索引对象Index {#索引对象index}1. Series和DataFrame中的索引都是Index对象2. 索引对象不可变,保证了数据的安全常见的Index种类Series索引 {#series索引}1. index 指定行索引名2. 行索引3. 切片索引4. 不连续索引5. 布尔索引DataFrame索引1. columns 指定列索引名2. 列索引3. 不连续索引高级索引原创 2021-10-15 10:35:07 · 60364 阅读 · 34 评论 -
Python可视化库matplotlib(超详细)
超详细Matplotlib笔记Matplotlib 简介开发环境搭建为什么要学习Matplotlib绘制基础图形绘制流程认识Matplotlib图像结构实现基础绘图功能设置标签文字和线条粗细解决中文乱码&符号不正常显示绘制直线绘制折线折线图案例准备数据并画出初始折线图添加自定义x,y刻度添加网格显示添加描述信息图像保存完整代码绘制一元二次方程的曲线y=x^2绘制正弦曲线和余弦曲线散点图格式化字符绘制柱状图绘制饼状图绘制直方图绘制等高线图绘制三维图Matplotlib 简介Matplotlib 是原创 2021-07-01 10:18:19 · 35631 阅读 · 45 评论 -
平滑处理matplotlib折线图(plot)得到美化效果
在平常的绘图任务中,常常会遇到绘制折现图的情况;但是有时候为了美观或者大致了解数据的波动情况,就需要将已有的折线图修改成更加平滑的曲线。为了解决上述问题,我们首先从原理角度来介绍折现图转曲线图的相关理论。折现转曲线无非就是在已有折现图的数据基础上在各折现数据中间填充更多的样本点,这样绘制出来的折线图从视觉的角度来看,就显得更加平滑了。原创 2024-07-02 15:13:29 · 28 阅读 · 1 评论 -
【西电考研复试】数据挖掘
【考研复试】数据挖掘原创 2023-04-26 15:12:56 · 317 阅读 · 0 评论 -
《2021全国大学生数学建模竞赛B题》复试回顾及面试问答预防
2021全国大学生数学建模竞赛B题摘要及总结由于复试需要进行比赛回顾!这个比赛是一个数学建模比赛,题目背景是关于乙醇催化制备C4烯烃的工艺条件的探究。我们的任务是通过构建一个BP神经网络模型,根据给定的数据集和已有的催化剂组合设计,预测出C4烯烃收率最高的催化剂组合范围,并进行优化。这个比赛的难点主要在于需要对原始数据进行处理和清洗,并构建一个可靠的神经网络模型。在数据处理和模型构建方面,我们需要进行大量的尝试和实验,寻找最佳的方法和参数。我在团队中主要负责数据处理、模型建立和编码的工作。原创 2023-04-26 15:06:05 · 160 阅读 · 0 评论 -
《2022美国大学生数学建模竞赛C题》复试回顾
(主要是数据预处理(缺失值处理、数据归一化、数据划分、训练集/测试集构建),模型训练,超参调节(seq_len、epochs),模型评估(均方差损失、rms),模型保存与使用)如下图所示,步阶为2代表2个X(步阶多少就有多少个X),一个Y(这个不会变的),简单地说,就是用第1,2天的数据预测第3天,用第2,3天的数据预测第4天,以此类推。模型选择:需要选择适当的深度学习模型进行股票价格预测,例如本题中选择的LSTM模型,也可以考虑其他的神经网络模型,例如GRU、CNN等。黄金和比特币是其中两种波动性资产。原创 2023-04-23 16:42:55 · 158 阅读 · 0 评论 -
Echarts 数据可视化
应对现在数据可视化的趋势,越来越多企业需要在很多场景(营销数据,生产数据,用户数据)下使用,可视化图表来展示体现数据,让数据更加直观,数据特点更加突出。D3.js 目前 Web 端评价最高的 Javascript 可视化工具库(入手难)ECharts.js 百度出品的一个开源 Javascript 数据可视化库Highcharts.js 国外的前端数据可视化库,非商用免费,被许多国外大公司所使用AntV 蚂蚁金服全新一代数据可视化解决方案 等等。原创 2023-04-16 14:15:09 · 290 阅读 · 0 评论 -
基于LSTM时间序列分析预测拉尼娜年天气
【代码】基于LSTM时间序列分析预测拉尼娜年天气。原创 2023-02-10 18:24:55 · 498 阅读 · 2 评论 -
【数据分析与挖掘】期末复习笔记(不挂科)
【Python数据挖掘】期末复习笔记笔记KDD聚类数据的属性类型四分位数极差(IQR)笔记KDDKDD全称Knowledge Discovery in Database:数据挖掘与知识发现聚类聚类(Clustering)是把数据对象划分成子集的过程,就是将数据分组成为多个类(Cluster)。在同一个类内对象之间具有较高的相似度,不同类之间的对象之间的差异较大。数据的属性类型数据的属性类型有: 1、标称属性。 标称属性的值是一些符号或实物的名称,每个值代表某种类别、编码或状态,原创 2021-12-23 11:34:24 · 1860 阅读 · 1 评论 -
【Python数据分析与可视化】期末复习笔记整理(不挂科)
【Python数据分析与可视化】期末复习笔记3. NumPy数值计算基础忘了的函数ndarray 对象属性和数据转换4. Pandas统计分析3. NumPy数值计算基础忘了的函数linspace(start, end, count):创建等差数列logspace(start, end, count):创建等比数列diag:创建对角矩阵,即对角线元素为0或指定值,其他元素为0eye:创建一个对角线位置为1,其他位置全为0的矩阵sort:axis=1,沿横轴排序,axis=0,沿着纵轴排序.原创 2021-12-13 17:04:29 · 6926 阅读 · 0 评论 -
【机器学习必备知识】NumPy线性代数详解
NumPy 线性代数前言numpy.dot()numpy.vdot()numpy.inner()numpy.matmulnumpy.linalg.det()numpy.linalg.solve()numpy.linalg.inv()前言机器学习里面用到许多线性代数的知识,因此NumPy的线性代数相关操作,你一定要懂点儿哦!NumPy 提供了线性代数函数库 linalg,该库包含了线性代数所需的所有功能,可以看看下面的说明:函数描述dot两个数组的点积,即元素对应相乘。vdo原创 2021-12-10 20:38:56 · 640 阅读 · 0 评论 -
【Python数据分析与可视化】自行车租赁统计数据分析(综合实训)
自行车租赁统计数据分析查看有无缺失值查看待处理数据的数据类型 实训:自行车租赁统计数据分析 import numpy as npimport pandas as pdimport datetimeimport matplotlib.pyplot as pltimport seaborn as snsplt.figure(figsize = (10,8))%matplotlib inlinebike = pd.read_csv('data//bike.csv')bike.head()原创 2021-12-06 15:18:34 · 2347 阅读 · 0 评论 -
【Python数据分析与可视化】pyecharts数据可视化(实训六)
pyecharts数据可视化(实训六)示例代码示例代码from pyecharts import options as optsfrom pyecharts.globals import ThemeTypeimport numpy as np%matplotlib inlinefrom pyecharts.charts import Bar# x轴数据items = ["相机", "短视频", "视频", "浏览器", "商城", "购票", "小说", "聊天", "小工具", "理财原创 2021-12-06 15:10:23 · 2852 阅读 · 4 评论 -
【Python数据分析与可视化】Seaborn数据可视化(实训五)
泰坦尼克号幸存者数据分析与可视化Seaborn初探导入模块获取数据查看有无缺失值用年龄的均值进行缺失值的填充,再进行年龄分布的可视化;4) 显示登船地点(S,C,Q)的人数;5) 对登船地点进行缺失值的填充(填充为S);6) 对于deck字段,由于缺失值太多,将其删除;数据探索1) 可视化乘客的性别分布;2) 基于性别,绘制乘客年龄分布箱线图;3) 对船舱等级进行计数4) 结合船舱等级,绘制乘客年龄分布,绘制乘客年龄分布的琴图5) 对alone进行计数6) 对年龄进行分级,分开小孩和老人的数据对分级后的年龄原创 2021-12-06 15:02:35 · 3692 阅读 · 0 评论 -
【Python数据分析与可视化】Matplotlib数据可视化(实训四)
全球星巴克门店数据分析import pandas as pdimport numpy as npfrom pandas import Series,DataFrameimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus']=False #用来正常显示负号%matplotlib inlinestarbucks原创 2021-12-06 14:47:37 · 3193 阅读 · 0 评论 -
【Python数据分析与可视化】Pandas数据载入与预处理(实训三)
小费数据预处理import pandas as pdimport numpy as npfdata=pd.read_excel('tips_mod.xls')fdata.head() Unnamed: 0 消费总额 小费 性别 是否抽烟 星期 聚餐时间段 人数 0 0 16.99 1.0原创 2021-12-06 14:34:47 · 1283 阅读 · 0 评论 -
【Python数据分析与可视化】Pandas统计分析(实训二)
【Python数据分析与可视化】Pandas统计分析(实训二)对小费数据集进行数据分析与可视化1.导入模块2.获取数据3.分析数据(1) 查看数据待描述信息(2)修改列名为汉字,并显示前5行数据(3)增加一列“人均消费”(4)查询抽烟男性中人均消费大于15的数据(5)分析小费和总金额的关系(6)分析男女顾客哪个更慷慨,分组看看男性还是女性的小费平均水平更高(7)分析日期和小费的关系(8)性别+抽烟书对慷慨度的影响(9)聚餐时间与小费数额的关系对小费数据集进行数据分析与可视化1.导入模块import n原创 2021-12-06 14:30:10 · 4861 阅读 · 3 评论 -
【Python数据分析与可视化】NumPy数值计算(实训一)
NumPy数值计算(实训一)1.导入模块2.获取数据3.数据清理:去掉索引号4.数据统计(1)创建数据类型(2)创建二维数组(3)将待处理数据待类型转化为float类型(4)数据排序(5)数据去重对指定列求和、均值、标准差、方差、最小值、最大值1.导入模块import numpy as npimport csv2.获取数据iris_data = []with open("data//iris.csv") as csvfile: # 使用csv.reader读取csvfile中的文件原创 2021-12-06 14:08:23 · 1152 阅读 · 0 评论 -
你还在担心期末复习没有题目做?爬虫帮帮你
你还在为期末复习没有题目做?前言题库刷题暴力输出结果展示前言数据分析期末复习,因为是学校第一年考试,只能去互联网上找题啦!给大家推荐一个宝藏级的考试系统,里面有各种计算机科目的练习题,可以直接在上面答题练习,也可以像我一样暴力输出。题库刷题暴力输出暴力爬取全部题目信息及答案!"""@Author: ZS@CSDN : https://zsyll.blog.csdn.net/@Time : 2021/12/3 20:15"""import requestsimport原创 2021-12-03 22:07:36 · 1006 阅读 · 0 评论 -
【特征提取】pd.get_dummies() 详解(One-Hot Encoding)
pd.get_dummies 详解Pandas.get_dummies 用法简单介绍主要参数介绍dataprefixprefix_sep其他参数(Parameters)Pandas.get_dummies 的用法可以对指定列进行get_dummies将指定列进行get_dummies 后合并到元数据中Pandas.get_dummies 用法简单介绍Pandas 中的 get_dummies 方法主要用于对类别型特征做 One-Hot 编码(独热编码)。pandas.get_dummies(data,原创 2021-11-23 16:48:08 · 10244 阅读 · 0 评论 -
PyEcharts 深入学习(一)
PyEcharts 深入学习1. PyEcharts 概述1.1 导入图表类型1.2 添加数据1.3 设置图表样式1.4 输出图表1.5 链式调用1.6 实例2. PyEcharts 直角坐标系图表之柱状图/条形图2.1 导入所需包2.2 构造数据2.3 直角坐标系图表通用方法2.4 柱状图 Y 轴配置项2.5 初始化配置项2.6 实例2.7 数据项接口2.8 坐标轴配置项2.9 工具箱配置项2.10 标记点数据项2.11 区域缩放配置项3. PyEcharts 直角坐标系图表之折线/面积图3.1 导入所需原创 2021-11-23 09:17:53 · 1323 阅读 · 4 评论 -
【项目实战】心脏病患者数据分析和建模
心脏病患者数据分析和建模读取数据患病的分布情况性别和患病的分布年龄分布情况统一看下所有特征的分布情况建模操作数据预处理K近邻决策树随机森林逻辑回归SGD分类import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport warningswarnings.filterwarnings('ignore')from pylab import mpl# 设置显示中文字体m原创 2021-11-19 22:18:12 · 4141 阅读 · 8 评论 -
【项目实战】Airbnb爱彼迎-数据分析与建模
Airbnb数据分析与建模Calendar数据集分析对price价格数据进行处理处理时间序列可视化分析listings数据集分析对价格数据进行预处理处理价格缺失值新增字段获取详细数据数据可视化Reviews数据集分析预测房间价格评论数量的预测import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom pylab import mpl# 设置显示中文字体mpl.rcPa原创 2021-11-19 21:45:18 · 3210 阅读 · 14 评论 -
【宝藏级】全网最全的Seaborn详细教程-数据分析必备手册(2万字总结)
数据分析必备手册-Seaborn详细教程seaborn库安装:官方文档:关系绘图relplot1. 基本使用:2. 添加hue参数:3. 添加col和row参数:4. 指定具体的列:5. 绘制折线图:分类绘图1. 分类散点图:1.1. stripplot:1.2. swarmplot:1.3. 横向分类散点图:2. 分类分布图:2.1. 箱线图:2.2. 小提琴图:3. 分类统计图:3.1. 条形图:3.2. 柱状图:3.3. 点线图:分布绘图单变量分布:二变量分布:散点图:六边形图:jointplot其他原创 2021-11-12 21:12:18 · 24762 阅读 · 12 评论 -
年鉴表格-数据可视化分析
年检表格数据可视化分析导入科学计算库获取数据数据合并缺失值处理相关性分析绘制热力图协方差计算相关系数皮尔逊相关系数(Pearson Correlation Coefficient)斯皮尔曼相关系数(Rank IC)回归分析案例分析获取特征与标签数据正规方程梯度下降法岭回归谢谢!导入科学计算库import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport osimpor原创 2021-11-01 14:04:20 · 1381 阅读 · 14 评论 -
Matplotlib折线图(x/y轴刻度、刻度标签、标签旋转)
代码示例:import randomfrom matplotlib import pyplot as plt x = range(2,26,2) y = [random.randint(12,35) for i in x]plt.figure(figsize=(20,8),dpi=80) # 设置x轴的刻度# plt.xticks(x)# 设置y轴的刻度# plt.yticks(range(min(y),max(y)+1)) # 构造x轴刻度标签xticks_label = [f原创 2021-11-01 10:36:25 · 2297 阅读 · 0 评论 -
【完整版】Pandas 层级索引
Pandas 层级索引1. 创建层级索引的数据结构2. 多级索引的取值和切片3. 多级索引的数据累计方法4. 层级索引(hierarchical indexing)4.1 MultiIndex索引对象4.2 选取子集1. 外层选取:2. 内层选取:4.2 交换分层顺序swaplevel()4.3 交换并排序分层sortlevel()Pandas数据结构中最常用的是Series和DataFrame,它们分别用于处理一维数据和二维数据。但我们也经常遇到存储多维数据的需求,数据索引超过一两个键,这种情况下的数据原创 2021-11-01 09:31:14 · 721 阅读 · 0 评论 -
Pandas的数据输出显示设置
Pandas的数据输出显示设置常用完整常用import pandas as pdpd.options.display.max_columns = None #列数pd.options.display.max_rows = None #行数完整Pandas数据分析时经常需要打印输出数据,当数据量大时,输出的展示设置非常重要,好的展示可以帮助更好地理解数据。Pandas相关的显示设置函数主要有以下三个:函数作用pd.pandas.set_option(‘参数名’, 参数值)设置相关显原创 2021-11-01 09:06:27 · 523 阅读 · 0 评论 -
【数据挖掘】鸢尾花分析实验与数据降维
鸢尾花分析实验与数据降维相关性分析特征工程-特征降维低方差特征过滤相关系数皮尔逊相关系数(Pearson Correlation Coefficient)斯皮尔曼相关系数(Rank IC)主成分分析(PCA)实验目的:用鸢尾花数据,先进行可视化,然后算达到85%贡献率的最佳维数,如果这个维数不好,继续降维。import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom pylab import mplimport原创 2021-10-27 17:05:40 · 3381 阅读 · 2 评论 -
【宝藏级】全网最全的Matplotlib详细教程-数据分析必备手册(4.5万字总结)
【宝藏级】全网最全的Matplotlib详细教程(2万字总结)1. 数据分析中常用图折线图:柱状图:直方图:散点图:饼状图:箱线图:更多参考:2. Matplotlib库安装:基本使用:设置图的信息:设置线条样式:设置轴和标题:设置marker:设置注释文本:设置图形样式:保存图片:绘制多个图:绘制多根折线:绘制多个子图:风格设置:官方文档介绍:3. 条形图条形图的绘制:横向条形图:分组条形图:堆叠条形图:条形图应用场景:4. 直方图绘制直方图:案例:直方图的应用场景:5. 散点图绘制散点图:绘制回归曲线:原创 2021-10-18 20:45:41 · 3390 阅读 · 0 评论 -
【散点图绘制】二手车年份、距离与保值率(二手车价/新车价格)分析
【散点图绘制】二手车年份、距离与保值率(二手车价/新车价格)分析散点图绘制入门二手车数据散点图作业要求观察结果散点图绘制入门import matplotlib.pyplot as pltimport pandas as pdimport numpy as npathletes = pd.read_csv('new_athlete.csv').dropna()athletes.head() Unnamed: 0 Name原创 2021-10-18 12:19:04 · 718 阅读 · 0 评论 -
【十三香吗?】网易严选-苹果12商品评论数据可视化分析
苹果手机评论数据可视化分析1. 爬取数据2. 准备工作3. 数据预处理4. 词云可视化5. 词频可视化5.1 绘制柱状图5.2 绘制饼图6. 评分可视化6.1 柱状图6.2 环形图6.3 折线图7. 购机时间可视化7.1 绘制柱状图7.2 绘制环形图7.3 绘制折线图8. 内存大小可视化8.1 绘制柱状图8.2 绘制环形图8.3 绘制折线图9. 手机颜色可视化9.1 绘制柱状图9.2 绘制饼图9.3 绘制折线图1. 爬取数据请参考:【Scrapy框架实战】爬取网易严选-苹果12手机热评2. 准备工作原创 2021-09-29 20:49:33 · 788 阅读 · 0 评论 -
【回炉重造】Python之numpy详细教程(2万字总结)
Python之numpy详细教程前言安装:Numpy库介绍安装:教程地址:Numpy数组和Python列表性能对比:NumPy数组基本用法numpy中的数组:创建数组(np.ndarray对象):ndarray常用属性:`ndarray.dtype`:`ndarray.size`:`ndarray.ndim`:`ndarray.shape`:`ndarray.itemsize`:Numpy数组操作数组广播机制:数组与数的计算:数组与数组的计算:广播原则:数组形状的操作:reshape和resize方法:fl原创 2021-09-16 15:00:13 · 1331 阅读 · 0 评论 -
【数据分析必备工具】Jupyter notebook使用
Jupyter notebook使用Jupyter notebook使用常用快捷键:命令模式(按Esc键):编辑模式:注意事项:Jupyter notebook使用常用快捷键:命令模式(按Esc键):Enter:转入编辑模式Shift-Enter:运行本单元,选中下个单元Ctrl-Enter:运行本单元Alt-Enter:运行本单元,在其下插入新单元Y:单元转入代码状态M:单元转入markdown状态R:单元转入raw状态1:设定 1 级标题2:设定 2 级标题3:设定 3 级标原创 2021-09-16 14:07:27 · 610 阅读 · 0 评论 -
【建议收藏】带你入门数据分析及环境搭建
数据分析前奏数据分析介绍什么是数据分析?数据分析六大步骤数据分析的误区数据分析的方法和工具工具和代码该怎么选环境搭建Python版本:Anaconda:Anaconda prompt:Anaconda Navigator:Spyder:jupyter notebook:使用jupyter notebook的姿势:conda基本使用:环境管理:包管理:数据分析介绍什么是数据分析?数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分原创 2021-09-16 14:04:17 · 1682 阅读 · 0 评论 -
HENAU 2021届新生大数据分析
HENAU 2021th FreshMan DataAnalysis导入科学计算库读取新生数据数据预处理数据分析男女比例绘制环形图民族分布绘制柱状图绘制环形图生源省份分布绘制生源最多的10个省份绘制词云绘制地图政治面貌年龄最小年龄最大年龄技术博客如有不足请大家指教谢谢欣赏!!!导入科学计算库# 导入科学计算库import numpy as npimport pandas as pd import matplotlib.pyplot as pltimport seaborn as snsimpo原创 2021-09-14 11:27:38 · 932 阅读 · 0 评论 -
RuntimeWarning: More than 20 figures have been opened.
【Matplotlib】RuntimeWarning: More than 20 figures have been opened.如果你创建了太多的 figure 对象,你会收到这个警告。使用以下代码,能清除并且关闭掉 figure 对象:plt.cla()plt.close("all")但是请注意,如果你需要画很多图,这样频繁的 “创建→清除” 是会拖慢你的代码运行速度的。最好的办法是:只创建一个 figure 对象,在画下一个图之前,使用 plt.clf() 清理掉 axes,这样可以复原创 2021-08-23 09:49:24 · 1649 阅读 · 0 评论