python
文章平均质量分 97
BloodyBlondie
这个作者很懒,什么都没留下…
展开
-
Python 分类和聚类结果的可视化 绘制出点的外接多边形 ConvexHull函数
以iris为例,最终画出来的图在最下面,真的很好看。#########################################################################Call required librariesfrom sklearn import datasetsimport numpy as np # Data manipulationimport pandas as pd # Dataframe manipulati原创 2020-09-26 09:51:15 · 1715 阅读 · 0 评论 -
Python 房价预测 kaggle 线性回归 SVM 神经网络 随机森林 集成模型
摘要现如今房产成为大多数家庭总资产中占比最大的一部分,也成为国人投资的重要渠道,研究和预测房产价格对我国人民和宏观经济发展都有重要价值。本文对包含房产各项基本信息及价格的数据进行处理,利用包括线性回归、核岭回归、支持向量回归、神经网络、决策树以及集成方法等多种数据挖掘算法对房产价格构建预测模型,并利用均方误差作为指标对各模型作出了相应评价。总体来看,本文根据房产信息对房产价格做出了较好的预测模型,为房地产相关行业与从业人员提供了较有力的决策依据。关键词: 房价预测;模型比较;线性模型;集...原创 2020-09-25 21:51:55 · 6426 阅读 · 1 评论 -
python 隐马尔可夫模型的中文分词和词性分类实验 hmm
一、研究背景及意义1.1 研究背景和研究意义在中文里面,词是最小的能够独立活动的有意义的语言成分,分词和词性标注都是中文自然语言处理的基础工作,能够后续如句法分析带来很大的便利性。1.2 研究内容简要介绍第一章是中文分词实验,先讲了中文分词是什么、中文分词的常用方法、中文分词的难点,再介绍隐马尔可夫模型并描述隐马尔可夫模型运用到中文分词的原理,接下来是实际操作与遇到的问题第二章是词性标注实验,先介绍词性标注与词性标注的难点,然后介绍隐马尔可夫模型如何应用到词性标注,最后是实际操作。第原创 2020-07-11 14:26:45 · 9767 阅读 · 11 评论 -
python 批量读取数据 同时读取一个文件夹下的所有文件数据
导包import pandas as pd # Dataframe manipulatioort os # For os related operationsimport sys # For data sizeimport glob读取数据# use your pathpath = r'C:/Users//VScode Python/week10_data' # advisable to u原创 2020-05-24 13:26:43 · 3301 阅读 · 0 评论 -
python 自编FCM模糊聚类
导入包from sklearn import datasetsfrom sklearn.utils.linear_assignment_ import linear_assignmentimport seaborn as snsimport matplotlib.pyplot as pltimport copyfrom sklearn.metrics import confusion_matrixfrom sklearn import metricsimport pandas as pdi原创 2020-05-24 13:17:09 · 766 阅读 · 0 评论 -
python 编写聚类指标purity纯度和jaccard函数
自编purity纯度和jaccard函数,最后运算速度都挺快的,另外,似乎用scipy中的混淆矩阵也可以编写scipy,而且要比我写的jaccard简便一些,可能是把我写的一些封装了吧。from sklearn import datasetsfrom sklearn.utils.linear_assignment_ import linear_assignmentimport seaborn as snsimport matplotlib.pyplot as pltimport copyfrom原创 2020-05-24 12:32:49 · 2170 阅读 · 5 评论 -
python 实例 混合数据聚类k-prototypes gower距离
对连续变量和分类变量混合的数据进行聚类,用了两种方法,k-prototypes和gower距离+kmeans,两种方法都是python直接编写没调包。import pandas as pdimport numpy as npimport warningsimport matplotlib.pyplot as pltfrom sklearn.cluster import KMeansfrom sklearn import metricsimport seaborn as snsplt.rcPa原创 2020-05-24 12:21:19 · 4617 阅读 · 3 评论 -
python 实例 SVM SVR cv 核函数 LinearSVR、RBFSampler、 SGDRegressor和 Nystroem的使用
SVM实例,两个数据,两个例子。cancer data样本量小,分类数据用svc函数,较为简单;houseprice样本量大,连续数据,用了支持向量回归SVR,函数先用了RBFSampler和 Nystroem做核映射,然后用SGDRegressor做支持向量回归,使用的这三个函数都很适合大样本。I. 准备1.import...In[1]:import pandas as pdimport numpy as npimport warningsimport matplotlib..原创 2020-05-24 12:01:38 · 6501 阅读 · 1 评论 -
python 实例 神经网络 MLPClassifier ann
I.准备1.import...In[112]:import pandas as pdimport warningsimport numpy as npfrom sklearn.model_selection import train_test_splitfrom sklearn.neural_network import MLPClassifierplt.rcParams['font.sans-serif'] = ['SimHei'] # 绘图时可以显示中文plt.rcPara.原创 2020-05-24 11:50:50 · 2394 阅读 · 0 评论 -
python 实例 Naive Bayes 决策树(ID3 CART)
I.准备1.import...In[8]:import pandas as pdimport matplotlib.pyplot as pltimport matplotlib.mlab as mlabimport warningsimport numpy as npimport seaborn as snsfrom sklearn.model_selection import train_test_split from sklearn.naive_bayes import .原创 2020-05-24 11:48:04 · 413 阅读 · 0 评论 -
python iris 自编PCA和LDA dict转dataframe 平行坐标图
文章内容:使用鸢尾花数据,将sklearn自带的iris从字典dict格式转化为dataframe格式,用平行坐标图进行可视化,由图认为有必要做PCA和LDA,利用PCA和LDA的原理自编函数实现降维分析,分别绘制图像import pandas as pdimport matplotlib.pyplot as pltimport matplotlib.mlab as mlabimport warningsimport numpy as npimport seaborn as snsfrom原创 2020-05-24 11:43:17 · 758 阅读 · 0 评论 -
python 单变量数据预处理 缺失值 异常值
python 单变量数据预处理 缺失值 异常值0.准备In[201]:import pandas as pdimport matplotlib.pyplot as pltimport matplotlib.mlab as mlabimport warningsimport numpy as npimport seaborn as snsfrom sklearn.model_selection import train_test_split from sklearn impor.原创 2020-05-24 11:33:52 · 803 阅读 · 0 评论 -
python R 空间自回归模型SAR 参数估计 统计模拟 实验
一、编写一次估计函数1. 载入numpy、固定随机种子import numpy as np np.random.seed(1)2. 编写makeY函数,生成用于模拟实验的Ydef makeY(rho, sigma2true, Ysize): I = np.identity(Ysize) W = I/rho # 使用while语句,...原创 2020-04-23 12:33:09 · 4625 阅读 · 1 评论