- 博客(14)
- 收藏
- 关注
原创 线性回归过拟合及线性回归、Lasso回归、Ridge回归、ElasticNet回归的多项式过拟合比较
import numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as plt%matplotlib inline%config InlineBackend.figure_format = 'svg'import warningsfrom sklearn.linear_model...
2019-05-09 21:25:38 663
原创 线性回归多项式拟合——家庭用电预测
LinearRegression模型参数fit_intercept: 训练的模型是否包含截距,默认为为True,表示包含LinearRegression模型属性coef_ :模型训练好后的参数列表intercept_: 截距值train_test_split方法参数数据参数:第一个参数是X,第二个参数为Y;test_size:进行数据划分的时候,测试集占用的比例train_size...
2019-05-06 20:06:08 1722 3
原创 线性回归预测--家庭用电功率与时间的关系&&功率与电流的关系
线性回归预测–家庭用电功率与时间的关系&&功率与电流的关系具体过程如下:import timeimport numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as plt% matplotlib inline%config InlineBackend.figu...
2019-05-06 13:20:26 1039 1
转载 学习如何将Python和R结合使用,以便在单个数据科学项目中充分利用它们
转载自DataCamp:https://www.datacamp.com/community/tutorials/using-both-python-r利用Python和R的优点学习如何将Python和R结合使用,以便在单个数据科学项目中充分利用它们。数据科学已成为当今每个行业不可或缺的一部分。从银行业到保险业再到医疗保健,每天都会产生大量的数据。因此,我们必须能够利用这些海量数据来产生可操...
2019-05-03 09:38:14 391
转载 dfs bfs
实验目的:了解和掌握深度优先和宽度优先算法的原理以及应用并实现两种算法。实验内容:1. 算法原理首先,我们给定一个二叉树图如下: 1). 宽度优先搜索:宽度优先搜索算法(Breadth First Search,BSF),思想是:· 1.从图中某顶点...
2019-04-16 23:04:21 196
原创 python实现匈牙利算法
1.通过深度优先搜索实现匈牙利算法#-*-coding:utf-8-*-#created by lixiao at 2019/4/16class DFS_hungary(): def __init__(self, nx, ny, edge, cx, cy, visited): self.nx, self.ny=nx, ny #x和y集合中顶点的个数 ...
2019-04-16 22:51:54 3753 1
原创 最小生成树(Python实现)--kruskal算法、prim算法、破圈法
设图为G=(V,E)避圈法: 以V上的空图为初始图进行加边操作,依次检查E的边,如果该边加到当前图上不产生圈则将该边加上,否则检查下一条未检查边直至所有边都被检查;破圈法:以G为初始图进行去边操作,依次检查E的边,如果该边被当前图的某个圈包含则将该边去掉,否则检查下一条未检查边直至所有边都被检查。通俗来讲:避圈法是:你一直找最短的边然后保留下来,前提是不会形成回路;破圈法是:看见回路就找那...
2019-04-16 20:20:01 12390 2
原创 贷款预测--12种pandas数据分析技巧
一次偶然的机会在知乎上发现了Analytics vidhya这个网站,对将要实习的我来说简直是如获至宝。网站中关于数据分析的方法和案例都有很详细的说明。通过浏览网页,我决定第一个项目从贷款预测入手,巩固一下pandas的基础。import pandas as pdimport numpy as npimport matplotlib.pyplot as pltdata = pd.read...
2019-04-11 22:49:55 1139
原创 分布式文件系统HDFS
HDFS是GFS的开源实现普通的文件系统只需要单独的计算机节点就可以完成文件的存储和处理,单个计算机节点由处理器、内存、高速缓存和本地磁盘构成。分布式文件系统把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群。集群中的计算机节点存放在机架上,每个机架可以存放8~64个节点,同一机架上的不同节点之间通过网络互连,多个不同机架之间采用另一级网络或交换机互连。一、分布式文件系统的...
2019-04-04 10:18:56 1143
原创 Python实现两个图的交运算、并运算、差运算、对称差运算、联运算、积图、合成图
Python实现两个图的交运算、并运算、差运算、对称差运算、联运算、积图、合成图用python随机生成两张图G1,G2import networkx as nximport matplotlib.pyplot as pltimport numpy as npfrom numpy import randomG1 = nx.Graph()Matrix1 = np.array(ran...
2019-03-14 17:29:14 3018
原创 搭建myeclipse的maven环境
以下过程是在已安装jdk的前提下进行的。一、maven的下载安装下载maven压缩包apache-maven-3.0.5-bin.zip,下载地址http://archive.apache.org/dist/maven。搭建步骤:解压压缩包。配置MAVEN_HOME环境变量,并将maven的执行命令添加到path中去。使用mvn -v测试是否安装成功。修改maven的默认本地仓...
2019-03-12 21:02:44 147
原创 hadoop伪分布式环境搭建
伪分布式环境搭建1.hadoop简介2.hadoop有三种搭建模式:单机模式(基本没用)、伪分布式模式、完全分布式模式以伪分布式为主3.搭建步骤:(由于搭建之前未曾想过要写博客,之后由于该过程较复杂为记录备忘,所以文中部分图片使用的是北风网教学视频中的截图,不太清晰,请见谅)1)创建用户2)修改主机名及ssh免密码登录.ssh 密钥文件修改权限为600,否则会登录失败3)jdk安装...
2019-03-09 15:11:18 285
原创 Linux用tar解压文件,无法打开:没有该文件或目录
linux解压执行命令:前五个是独立的命令,压缩解压可以和别的命令连用但只能用其中一个。后五个是根据需要在压缩或解压档案时可选的。-c: 建立压缩档案-x:解压-t:查看内容-r:向压缩归档文件末尾追加文件-u:更新原压缩包中的文件-z:有gzip属性的-j:有bz2属性的-Z:有compress属性的-v:显示所有过程-O:将文件解开到标准输出1.错误描述2.可能出现...
2019-03-04 09:11:32 25389 2
原创 用python编写一个随机邻接矩阵(100个点),并绘制其图形。
1.设图G=<V,E>,其中V={v1,v2,…,vn},并假定结点已经有了从v1到vn的次序,则n阶方阵A=(aij)n*n成为G的邻接矩阵。其中:用python编写一个随机邻接矩阵(10000个点),并绘制其图形。import networkx as nximport matplotlib.pyplot as pltimport numpy as npfrom numpy...
2019-03-01 11:18:50 5963 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人