自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(56)
  • 收藏
  • 关注

原创 Spark wordCount报错Exception in thread “main“ java.lang.UnsatisfiedLinkError:

Exception in thread "main" java.lang.UnsatisfiedLinkError: 'org.apache.hadoop.io.nativeio.NativeIO$POSIX$Stat org.apache.hadoop.io.nativeio.NativeIO$POSIX.stat(java.lang.String)' at org.apache.hadoop.io.nativeio.NativeIO$POSIX.stat(Native Method) at org.

2021-08-03 17:24:27 579 2

原创 IDEA scala 报错Could not initialize class org.jetbrains.jps.builders.JpsBuildBundle

更改SDK 16 版本到15file-project structure

2021-07-14 10:17:14 4139 1

原创 商业分析 CBAP考试 每章节输入输出; Guidelines and Tools; Stakeholders

输入黑体实线输出 红色实线Guidelines and Tools:虚线;每个小结下面的数字 表示要参考的外部资料(总览在第三章右下角)Stakeholders:每个小结下面的字母 (总览在第三章右上角) 基本没记注意:为了画图方便,前面章节总结完的在后面章节不显示;如 第五章内容图 不显示 和第三章的关系,只显示和第7和6章的关系第六章中 6.2 和 第七章第八章 有点复杂,难以画在一个图中,就在第七章和第八章又补充了一些...

2021-04-23 12:27:52 337

转载 matlab 常用颜色,形状,粗细

转自https://blog.csdn.net/vertira/article/details/106943692颜色的改变 可以 通过改变R-G-B 的值改变线条的颜色:matlab命令 :plot(x,y,′Color′,[RGB]);RGB颜色表如下:二、改变曲线的粗细 ;通过改变c∈[1,+∞)c∈[1,+∞)的值改变线条的粗细matlab命令形式 plot(x,y,′linewidth′,c);三、改变曲线的形状,粗细,颜色:matlab 命令:...

2020-12-02 13:01:45 3629

转载 python 漏斗图

转载https://blog.csdn.net/qq_41080850/article/details/83933017本文主要用到的是pyecharts包,所以要保证电脑上已经安装了pyecharts包。漏斗图简介: 漏斗图常用于用户行为的转化率分析,例如用漏斗图分析用户购买流程中各个环节的转化率。但是单一的漏斗图反映的数据过于单一,无法比较,也就失去了分析的意义。对于用户购买流程,我们可以通过把流程优化前后的漏斗图放在一起,进行比较分析,得出相关结论。本文仅涉及漏斗图的绘制,不讨论具...

2020-09-19 23:49:11 1223

转载 python 时间坐标太长 设置主副坐标

转https://blog.csdn.net/dgatiger/article/details/104672904/1.解决的问题日期时间做X轴,设定主副刻度 当X轴为日期时间时,annotate标注功能X轴坐标获取问题,即将x轴所在点的日期时间通过mdates.date2num()转为数字即可。关键代码如下:ax1.annotate("annotate msg ", xy=(mdates.date2num(x[1]), sales[1]), xycoords='data', color='.

2020-09-19 19:03:15 625

转载 python(添加时间轴组件):玫瑰图分月展示2020年1-3月汽车销量(pyecharts)

python(添加时间轴组件):玫瑰图分月展示2020年1-3月汽车销量(pyecharts)转自https://zhuanlan.zhihu.com/p/144874116案例中数据表格结构如下:代码及演示:from pyecharts import options as optsfrom pyecharts.charts import Pie, Timelineimport pandas as pdfrom pyecharts.globals import ThemeT.

2020-09-19 18:10:30 532

转载 Python之列表与元组的区别详解

转https://blog.csdn.net/qq_878799579/article/details/72909828相同点:都是序列类型回答它们的区别之前,先来说说两者有什么相同之处。list 与 tuple 都是序列类型的容器对象,可以存放任何类型的数据、支持切片、迭代等操作foos = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]foos[0:10:2][0, 2, 4, 6, 8]bars = (0, 1, 2, 3, 4, 5, 6, 7, 8, 9)b.

2020-09-09 03:47:19 211

原创 python 画图去掉边框,设置百分比坐标轴,更改title位置

去掉边框ax.spines['top'].set_visible(False)ax.spines['right'].set_visible(False)ax.spines['left'].set_visible(False)设置百分比坐标轴def to_percent(temp, position): return '%1.0f'%(100*temp) + '%'plt.gca().yaxis.set_major_formatter(FuncFormatter(to_per...

2020-08-18 02:56:51 2057

转载 python seaborn画图

写的特别好https://blog.csdn.net/suzyu12345/article/details/69029106python seaborn画图以前觉得用markdown写图文混排的文字应该很麻烦,后来发现CSDN的markdown真是好用的。在做分析时候,有时需要画几个图看看数据分布情况,但总记不住python的绘图函数。今天有空顺便整理下python的seaborn绘图函数库。Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在.

2020-08-14 23:09:27 1421

原创 python 画图colorbar 颜色大全 plt.cm.get_cmap

名字后_r取反

2020-08-14 05:30:51 29098 2

原创 python sns画布大小设置

plt.figure(figsize=(8,4))这个我用不好用终于找到能用的country_sorted:数据g = sns.lmplot('数量','平均评分', country_sorted)g.fig.set_size_inches(8,4)plt.show()

2020-08-13 22:15:38 7686 4

原创 python sns画图中文显示

plt.rcParams['font.sans-serif'] = ['SimHei'] # 中文字体设置-黑体plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题sns.set(font='SimHei',font_scale=1.5) # 解决Seaborn中文显示问题并调整字体大小...

2020-08-13 22:12:50 3545

转载 Python 绘制不连续的坐标轴

转自https://blog.csdn.net/maryyu8873/article/details/84313423主题:利用python画图实现坐标轴截断或打断关键词:python, plot, matplotlib, break axes方法一:首先介绍一种简单快速的方法——调用包brokenaxes。详细请点击参考。import matplotlib.pyplot as pltfrom brokenaxes import brokenaxesimport numpy ...

2020-08-13 00:21:52 1972

转载 python 颜色大全

转载 https://blog.csdn.net/guoxinian/article/details/80242353'.' point marker',' pixel marker'o' circle marker'v' triangle_down marker'^' triangle_up marker'<' triangle_left marker'>' triangle_right mar.

2020-08-11 23:12:03 38961

转载 数据预处理——样本分布(正态分布、偏态分布)

转载自:https://blog.csdn.net/lanchunhui/article/details/53239441https://www.cnblogs.com/gczr/p/6802998.htmlhttps://blog.csdn.net/csdn_lzw/article/details/83387570一、何为数据的偏态分布?频数分布有正态分布和偏态分布之分。正态分布是指多数频数集中在中央位置,两端的频数分布大致对称。偏态分布是指频数分布不对称,集中位置偏向一侧。若集中位置偏向

2020-08-11 17:57:00 7638

转载 python q-q图 和PP图

转载于https://www.cnblogs.com/king-lps/p/7840268.html以供学习,侵权即删一. QQ图 分位数图示法(Quantile Quantile Plot,简称 Q-Q 图) 统计学里Q-Q图(Q代表分位数)是一个概率图,用图形的方式比较两个概率分布,把他们的两个分位数放在一起比较。首先选好分位数间隔。图上的点(x,y)反映出其中一个第二个分布(y坐标)的分位数和与之对应的第一分布(x坐标)的相同分位数。因此,这条线是一条以分位数间隔为参数...

2020-08-11 15:56:22 6062 1

原创 Python DataFrame 多字段排序

movies[movies["豆瓣评分"]>0].sort_values(["豆瓣评分","票数"],ascending=[True,False])豆瓣评分 按照降序豆瓣评分相同时 按照票数 升序

2020-08-11 07:09:09 1193

转载 python——修改Dataframe列名的两种方法

https://blog.csdn.net/chenKFKevin/article/details/72847622首先新建一个Dataframeimport pandas as pddf = pd.DataFrame({'a':[1,2,3],'b':[1,2,3]})如下: a b0 1 11 2 22 3 31、修改列名a,b为A、B。df.columns = ['A','B']2、只修改列名a为Adf.rename(columns={'...

2020-08-11 03:06:47 3487 3

原创 python pandas 赋值

赋值操作的时候应采用以下形式 41632是行号"GENRES" 字段名movies.loc[41632,"GENRES"] = "爱情"————————————————————————————————————————这个不管用!这个不管用!这个不管用!movies.loc[41632]["GENRES"] ="爱情"...

2020-08-11 01:29:29 675

原创 正则表达式提取字符串全部汉字或者全部英文

正则表达式提取字符串全部汉字str='严定宪 Dingxian Yan 王树忱 Shuchen Wang'findch= re.compile ('(.[\u4E00-\u9FA5]+)')cas_part_names = re.findall(findch,str)cas_part_names = ''.join (cas_part_names)[1:].replace (" (", ':').replace (");", ';').strip ()正则表达式提取字符串全部英文fi

2020-08-09 20:25:44 4168

转载 史上最全的正则表达式-匹配中英文、字母和数字

转载https://blog.csdn.net/qq_28633249/article/details/77686976在做项目的过程中,使用正则表达式来匹配一段文本中的特定种类字符,是比较常用的一种方式,下面是对常用的正则匹配做了一个归纳整理。1、匹配中文:[\u4e00-\u9fa5]2、英文字母:[a-zA-Z]3、数字:[0-9]4、匹配中文,英文字母和数字及下划线:^[\u4e00-\u9fa5_a-zA-Z0-9]+$同时判断输入长度:[\u4e00-\u9fa5_a-z.

2020-08-03 05:16:21 1431

原创 【python】 Beautiful Soup常用方法

Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.支持Python标准库中的HTML解析器,还支持一些第三方的解析器,如果我们不安装它,则 Python 会使用 Python默认的解析器html.parser这里用到的baidu.tml文件是<!DOCTYPE html><html><head> <meta content="text/ht.

2020-08-03 04:31:49 385

原创 【python】 urllib四大模块, urllib.request+ urllib.error+ urllib.parse + urllib.robotparse

urllib库urllib库是Python内置的HTTP请求库,它包含4个模块:1.urllib.request 负责请求http请求模块,可以用来模拟发送请求。就好比在浏览器中输入网址然后回车一样,只需要给库方法传入URL以及额外的参数,就可以模拟实现这个过程2.urllib.error 异常处理模块如果出现请求错误,我们可以捕捉这些异常,然后进行重试或其他操作,保证程序不会意外终止3. urllib.parse 负责解析个工具模块,提供了许多URL处理方法,比如拆分、解析、.

2020-08-03 03:53:53 1717

原创 python 异常处理 try except /try finally

try except 捕获异常try: print("------test------1-----") f = open("123.txt","r") print("------test------2-----")except IOError: # IOError 文件没找到,属于IO 输入输出异常 pass可以将可能忽略的异常都放在 except () 括号内,同时也可以打印出错误信息try: print("------test------1--

2020-07-28 20:55:49 220

原创 SQL(11) 流程控制结构 while+loop+repeat

第一部分的内容:SQL(2)DQL语言 条件查询+排序查询+常见函数+分组查询+连接查询https://blog.csdn.net/Lee_Yu_Rui/article/details/107527594SQL(3)DQL语言 子查询+分页查询+联合查询https://blog.csdn.net/Lee_Yu_Rui/article/details/107566293SQL(4)DML语言 增删改https://blog.csdn.net/Lee_Yu_Rui/article/det

2020-07-27 23:07:18 364

原创 SQL(10) 命令行的存储过程和函数

第一部分的内容:SQL(2)DQL语言 条件查询+排序查询+常见函数+分组查询+连接查询https://blog.csdn.net/Lee_Yu_Rui/article/details/107527594SQL(3)DQL语言 子查询+分页查询+联合查询https://blog.csdn.net/Lee_Yu_Rui/article/details/107566293SQL(4)DML语言 增删改https://blog.csdn.net/Lee_Yu_Rui/article/det

2020-07-27 19:34:22 458

原创 SQL(9)变量:系统变量和自定义变量

第一部分的内容:SQL(2)DQL语言 条件查询+排序查询+常见函数+分组查询+连接查询https://blog.csdn.net/Lee_Yu_Rui/article/details/107527594SQL(3)DQL语言 子查询+分页查询+联合查询https://blog.csdn.net/Lee_Yu_Rui/article/details/107566293SQL(4)DML语言 增删改https://blog.csdn.net/Lee_Yu_Rui/article/det

2020-07-27 19:30:29 375

原创 SQL(8)视图的创建+修改+删除+更新

第一部分的内容:SQL(2)DQL语言 条件查询+排序查询+常见函数+分组查询+连接查询https://blog.csdn.net/Lee_Yu_Rui/article/details/107527594SQL(3)DQL语言 子查询+分页查询+联合查询https://blog.csdn.net/Lee_Yu_Rui/article/details/107566293SQL(4)DML语言 增删改https://blog.csdn.net/Lee_Yu_Rui/article/det

2020-07-27 04:13:47 872

原创 SQL(7)TCL 事务控制语言 特点+演示+隔离级别+save point

第一部分的内容:SQL(2)DQL语言 条件查询+排序查询+常见函数+分组查询+连接查询https://blog.csdn.net/Lee_Yu_Rui/article/details/107527594SQL(3)DQL语言 子查询+分页查询+联合查询https://blog.csdn.net/Lee_Yu_Rui/article/details/107566293SQL(4)DML语言 增删改https://blog.csdn.net/Lee_Yu_Rui/article/det

2020-07-27 02:58:10 216

原创 SQL(6) 数据的常见约束和标识项

第一部分的内容:SQL(2)DQL语言 条件查询+排序查询+常见函数+分组查询+连接查询https://blog.csdn.net/Lee_Yu_Rui/article/details/107527594SQL(3)DQL语言 子查询+分页查询+联合查询https://blog.csdn.net/Lee_Yu_Rui/article/details/107566293SQL(4)DML语言 增删改https://blog.csdn.net/Lee_Yu_Rui/article/det

2020-07-27 02:33:13 243

原创 SQL(5) DDL语言 库和表的创建,修改和删除

第一部分的内容:SQL(2)DQL语言 条件查询+排序查询+常见函数+分组查询+连接查询https://blog.csdn.net/Lee_Yu_Rui/article/details/107527594SQL(3)DQL语言 子查询+分页查询+联合查询https://blog.csdn.net/Lee_Yu_Rui/article/details/107566293SQL(4)DML语言 增删改https://blog.csdn.net/Lee_Yu_Rui/article/det

2020-07-26 19:48:29 322

原创 SQL(4)DML语言 增删改

第一部分的内容:SQL(2)DQL语言 条件查询+排序查询+常见函数+分组查询+连接查询https://blog.csdn.net/Lee_Yu_Rui/article/details/107527594SQL(3)DQL语言 子查询+分页查询+联合查询https://blog.csdn.net/Lee_Yu_Rui/article/details/107566293感谢以下链接的教学分享,很好的视频和资源,笔记记录在这里,便于日后查看新i版-链接: https://pan.baidu.

2020-07-25 21:05:38 223

原创 SQL(3)DQL语言 子查询+分页查询+联合查+【查询语法总结 】

第一部分的内容:SQL(2)DQL语言 条件查询+排序查询+常见函数+分组查询+连接查询https://blog.csdn.net/Lee_Yu_Rui/article/details/107527594感谢以下链接的教学分享,很好的视频和资源,笔记记录在这里,便于日后查看新i版-链接:https://pan.baidu.com/s/1GDhRzV_3lUQaETsH4CM8zQ提取码:rpteDQL : Data query language、子查询# 进阶7 :子查询...

2020-07-25 04:09:42 184

原创 SQL(2)DQL语言 条件查询+排序查询+常见函数+分组查询+连接查询

感谢以下链接的教学分享,很好的视频和资源,笔记记录在这里,便于日后查看新i版-链接:https://pan.baidu.com/s/1GDhRzV_3lUQaETsH4CM8zQ提取码:rpteDQL : Data query language基础查询#基础查询/*语法:select 查询列表from 表名;特点:1.查询列表可以是:表中的字段,常量值,表达式,函数2.查询的结果是一个临时性的虚拟表格*/USE myemployees;# 1. 查询表中的单个字...

2020-07-23 05:20:57 430

原创 MySQL (1)基础命令

常见基础命令1. 查看当前所有数据库 show databases;2. 打开指定的库 use 库名3.查看当前库的所有表 showtables;4.查看其他库的所有表 show tables from 库名;5.创建表create table 表名( 列名 列类型, 列名 列类型);6. 查看表结构 desc 表名;7. 查看服务器的版本方式一 登录到mysql服务端 select ve...

2020-07-23 02:54:52 120

转载 sklearn的特征工程

以下内容转自 https://www.cnblogs.com/jasonfreak/p/5448385.html,感谢1 特征工程是什么?有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。通过总结和归纳,人们认为特征工程包括以下方面:特征处理是特征工程的核心部分,sklearn提供了较为完整的特征处理方法,包括数据预处理,特征选择,降维等。.

2020-07-21 17:36:59 298

原创 非监督分类-K-means系列(二) 应用实例

亚洲足球队等级分类数据统计了2006年,2010年世界杯以及2007年亚洲杯,将相同等级的足球队自动分组中国,50,50,9日本,28,9,4韩国,17,15,3伊朗,25,40,5沙特,28,40,2伊拉克,50,50,1卡塔尔,50,40,9阿联酋,50,40,9乌兹别克斯坦,40,40,5泰国,50,50,9越南,50,50,5阿曼,50,50,9巴林,40,40,9朝鲜,40,32,17印尼,50,50,9import numpy as npimpor.

2020-07-21 16:39:21 480

原创 非监督分类-K-means系列(一) 算法原理,步骤和python实现

基本原理”物以聚类,点以距离分“的思想。对于给定的样本集,根据样本之间的距离划分为K个族,让族内的点的距离尽量的小,族间的距离尽量大。主要步骤1.从数据中选择K个对象作为初始的距离中心2.计算每个聚类对象到聚类中心的距离,将每个对象划分到距离自己最近的聚类中心的一类3.在每类中重新计算聚类中心,并重复2的操作,知道到达最大迭代次数或者两次更新的聚类中心距离达到要求4.确定最优的聚类中心主要的缺陷1. K个初始中心的选择:K means++2. K值得确定,因为没有已知得.

2020-07-21 02:12:49 2817

原创 SVM系列(五)SVM python 应用实例(二) iris+ 西瓜数据

iris数据分类以及可视化1.多种核函数分类from sklearn.svm import SVCimport matplotlib.pyplot as plt%matplotlib inlinefrom sklearn import datasetsimport numpy as npfrom sklearn.model_selection import train_test_splitiris = datasets.load_iris()X = iris.data[:,:2]y

2020-07-20 19:24:23 1545

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除