自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 Mendeley插入文献,令 等 与 et al 共存

怎么能让中文文献出现等,英文出现et al?共分为两步。

2022-02-04 16:33:34 3122 1

原创 Tableau Day4 —— 标靶图、甘特图、瀑布图

1. 标靶图标靶图:在条形图的基础上,增加参考线或其他内容,可用于比较计划值和实际值之间的差距。绘制图像所用数据如下图所示:(1)二月份电量销售额完成情况学习内容链接:未明学院点击图片查看大图更清晰~...

2021-03-08 16:24:26 654

原创 Tableau Day3(2)—— 气泡图、词云

学习内容链接:未明学院点击图片查看大图更清晰~

2021-01-23 16:46:59 654

原创 Tableau Day3(1)—— 基本表、树形图

1. 基本表数据:与Day1和Day2相同,采用的是酒店数据。(1)基本表(2)凸显表在基本表的基础上制作凸显表。凸显表与基本表的区别:凸显表的数据带有不同颜色的色块,可视化效果更好。(3)二值凸显表——只有两个颜色凸显的表,中心值可自己设置2. 树形图(1)不同类型电影数量及票房树形图颜色维度和大小维度均可以表示相应信息。因此,绘制第一个图时将电影数量和票房分别用颜色和大小表示。累计票房——拆分——重命名——累计票房(万)图中有许多小数据,可以进行剔除。分析:

2021-01-18 11:40:00 230

原创 Tableau Day2——折线图、饼图、环形图

基于中国电影网数据和酒店数据绘制条形图、饼图和环形图。Tableau中无法直接绘制环形图,需要利用两个饼图完成。1. 条形图(1)数据概览及预处理选中数据列点击:右键——拆分,对拆分后的字段重命名,删除无用或重复的字段,隐藏拆分前的字段(数据中原本存在的字段只能隐藏不能删除)。对“上映时间”拆分时,软件会自动拆分为年、月、日三部分,为了只获取一列日期,此时需要采用自定义拆分方法:(2)绘制折线图切换到工具视图,绘制电影数量变化折线图。中国电影网数据数据满足一定的结构,可以自动进行拆分,

2021-01-17 10:08:54 437

原创 Tableau Day1——条形图、直方图

设置数据显示多少行数据源界面工作表界面筛选器:哪些数据想留下,哪些数据想要筛选掉页面:用于做动图的标记:可以自动识别图的类型,也可以自己强制图的类型是什么条形图:不同类别的比较,比如不同地区酒店数量条形图价格等级:看一下部分相对于整体的情况价格等级堆积图直方图:呈现数据的分布情况:标准型;锯齿形;偏锋型分区分的太细了,会出现锯齿形直方图的样子,解决方法是将分区划分的粗粒度一些正态分布,幂律分布等直方图只能是竖直的, 不能横过来,用来看数据的分布直方图需要首先分桶才能进行绘制(包含

2021-01-16 15:48:54 429

原创 Python pandas(二)- pandas基础

查看电脑上pandas的版本号为1.1.5,如果pandas的版本较低,需要进行更新import pandas as pdpd.__version__# 更新 pip install --upgrade pandas一、文件读取和写入1.1 文件读取最常用的文件读取语句为pd.read_csv、pd.read_table、pd.read_exceldf_csv = pd.read_csv('../data/my_csv.csv') df_txt = pd.read_table(

2020-12-19 23:16:09 359 1

原创 安装 PostgreSQL 报错 VC++ runtime error 的解决方法

win7系统上安装PostgreSQL9.6一路顺畅,在win10系统上安装遇到了两个报错:VC++ runtime errorFailed to load SQL modules into the database cluster1. VC++ runtime error问题的解决方法问题原因:可能是VC++ runtime 已经安装,所以在安装PostgreSQL时不安装VC++ runtime 即可,具体步骤如下:(1)Win + R 打开如下运行界面(2)输入 CMD , 进入 D

2020-12-19 15:09:44 1910 1

原创 Python pandas(一)- 预备知识

一、Python 基础1.1 列表推导式列表推导式将多行for循环写在一行上,使程序看起来简洁,需注意:多层嵌套时,易读性差,需要注意嵌套的顺序,列表推导式内部也会有列表推导式,用 [] 区分![ ? for i in ?] 。其中,第一个 ? 为映射函数,其输入为后面 i 指代的内容,第二个 ? 表示迭代的对象。[i ** 2 for i in range(5)]# 输出: [0, 2, 4, 6, 8]列表表达式多层嵌套[m + '_' + n for m in ['a', 'b

2020-12-16 18:27:29 426

原创 python 正则表达式 re模块

该文主要为概念详解(理解)。实例参见文末链接,博主示例写的很详细。python re 模块的使用 python 正则表达式字符""" 1、python re 模块的使用 """# (1)、re.match()# res = re.match(pattern, string, flags=0)尝试从字符串的起始位置匹配一个字符串,匹配以pattern开头的字符串# 成功返回match的"对象",否则返回None。调用:结果对象res.group()输出返回的结果,匹配失败不能用group#

2020-07-19 18:42:50 205

原创 Python 文本的特征提取与描述统计

基于公布的新冠病毒确诊患者病例,进行文本特征提取与描述统计分析。数据形式:import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltf = open(r'----你的路径----\新发地.txt', encoding='utf-8')data = []for line in f.readlines(): # line = line.split(',')

2020-06-15 23:58:51 1643

原创 Python matplotlib可视化分析(六)- Animation 动画

Python matplotlib 的使用进行了总结注释,学习内容来自B站up主莫烦Python,推荐!!!代码:import matplotlib.pyplot as pltimport numpy as npfrom matplotlib import animation# animation动画fig, ax = plt.subplots()x = np.arange(0, 2*np.pi, 0.01)line, = ax.plot(x, np.sin(x))def an

2020-06-05 11:25:06 851

原创 Python matplotlib可视化分析(五)- subplot gridspec subplots twinx twiny

对Python matplotlib 的使用进行了总结注释,学习内容来自B站up主莫烦Python,推荐!!!代码:

2020-06-05 10:53:19 622

原创 Python matplotlib可视化分析(四)- 3D图像

对Python matplotlib 的使用进行了总结注释,学习内容来自B站up主莫烦Python,推荐!!!3D数据:import matplotlib.pyplot as pltimport numpy as npfrom mpl_toolkits.mplot3d import Axes3D# 3D图像fg = plt.figure()ax = Axes3D(fig=fg) # 3D# X Y 的数据X = np.arange(-4, 4, 0.25)Y = np.aran

2020-06-04 23:11:42 607

原创 Python matplotlib可视化分析(三)- 散点图 柱状图 等高线图

对Python matplotlib 的使用进行了总结注释,学习内容来自B站up主莫烦Python,推荐!!!代码:import matplotlib.pyplot as pltimport numpy as np# scatter 散点图n = 1024 # 数据的size# 生成n个均值为0,方差为1的随机数X = np.random.normal(0, 1, n)Y = np.random.normal(0, 1, n)T = np.arctan2(Y, X) # 设置颜

2020-06-04 22:42:03 720

原创 Python matplotlib可视化分析(二)- 图例 注解Annotation

对Python matplotlib 的使用进行了总结注释,学习内容来自B站up主莫烦Python,推荐!!!代码:import matplotlib.pyplot as pltimport numpy as np# 不同的方法解决图例问题x = np.linspace(-3, 3, 50)y1 = 2*x + 1y2 = x**2plt.figure()plt.xlim(-1, 2)plt.ylim(-2, 3)plt.xlabel('I am x')plt.ylabe

2020-06-04 21:12:08 567

原创 Python matplotlib可视化分析(一)- 修改刻度 移动坐标轴

对Python matplotlib 的使用进行了总结,学习内容来自B站up主莫烦Python,推荐!!!代码:import matplotlib.pyplot as pltimport numpy as np# 最简单的画图x = np.linspace(-1, 1, 50)y = 2*x + 1plt.plot(x, y)plt.show()# figure图像,输出多张图像x = np.linspace(-3, 3, 50)y1 = 2*x + 1y2 = x**

2020-06-04 20:49:36 1968

转载 机器学习中的正则化(Regularization)

本文转自链接:http://www.cnblogs.com/maybe2030/博主对正则化进行了总结,转载用于学习文章总结机器学习中的正则化,包含:LP范数 L1范数 L2范数 L1 范数和L2范数的区别 Dropout Batch Normalization 归一化、标准化&正则化正则化(Regularization)的本质是对一个问题加以先验的概率限制或约束以达到某种目的的特定手段或操作。算法中使用正则化能够防止模型出现过拟合。1. LP范数范数简单...

2020-06-04 12:29:21 599

原创 Python sklearn 交叉验证

from sklearn.datasets import load_bostonfrom sklearn.model_selection import cross_val_scorefrom sklearn.tree import DecisionTreeRegressorboston = load_boston()regressor = DecisionTreeRegressor(random_state=0) # 实例化# 交叉验证有5个参数# 第一个参数:可以是任何实例化后的算法模.

2020-05-11 09:11:17 386

原创 解决pycharm中导入graphviz生成决策树中文乱码问题

解决pycharm中导入graphviz生成决策树中文乱码问题在pycharm里基于sklearn的wine数据生成决策树,遇到了决策树中文乱码的问题,是因为graphviz默认的fontname为helvetica,不能很好的显示中文。试了网上其他方法,对自己的电脑没有反应,摸索到了一个方法。程序代码from sklearn import treefrom sklearn.datase...

2019-12-01 19:43:20 2587 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除