数据分析
望极天涯
这个作者很懒,什么都没留下…
展开
-
30分钟学会用scikit-learn的基本回归方法(线性、决策树、SVM、KNN)和集成方法(随机森林,Adaboost和GBRT)
本文主要参考了scikit-learn的官方网站前言:本教程主要使用了numpy的最最基本的功能,用于生成数据,matplotlib用于绘图,scikit-learn用于调用机器学习方法。如果你不熟悉他们(我也不熟悉),没关系,看看numpy和matplotlib最简单的教程就够了。我们这个教程的程序不超过50行1. 数据准备为了实验用,我自己写了一个二元函数,y=0.5*np.si...转载 2019-04-06 23:26:43 · 364 阅读 · 0 评论 -
机器学习项目流程及模型评估验证
机器学习项目流程思维导图.JPGnumpy简单的统计分析整理import numpy as npa = np.array([1,2,3,4,5])# 最小值minimum_a = np.min(a)# 最大值maximum_a = np.max(a)# 平均值mean_a = np.mean(a)# 中位数median_a = np.median(a)# 标...转载 2019-04-06 23:36:04 · 370 阅读 · 0 评论 -
用KNN解决非线性回归问题
最近有一批数据,通过4个特征来预测1个值,原来用线性回归和神经网络尝试过,准确率只能到40%左右。用KNN结合网格搜索和交叉验证,正确率达到了79%,没错,KNN解决回归问题也很赞。什么是KNNKNN就是K近邻算法(k-NearestNeighbor),百度百科是这么写的:K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是...转载 2019-04-06 23:37:13 · 1451 阅读 · 2 评论 -
基于人工智能的5G无线网规划和优化
摘要:自组织网络(SON)在即将到来的5G系统中的功能是人工智能(AI)机制的一个很有前途的领域。在这方面,本文分析了如何在AI概念的基础上构建未来5G系统中无线接入网规划和优化的自组织网络。提出了一个框架,通过基于学习的分类、预测和聚类模型,对来自多个来源的输入数据进行处理,提取相关知识,以驱动5G自组织网络的决策。不同的基于人工智能的知识发现候选工具和相关的可以提取的知识模型一起被识别出来。在...转载 2019-04-07 15:01:00 · 1344 阅读 · 0 评论 -
聚类算法——python实现SOM算法
算法简介SOM网络是一种竞争学习型的无监督神经网络,将高维空间中相似的样本点映射到网络输出层中的邻近神经元。训练过程简述:在接收到训练样本后,每个输出层神经元会计算该样本与自身携带的权向量之间的距离,距离最近的神经元成为竞争获胜者,称为最佳匹配单元。然后最佳匹配单元及其邻近的神经元的权向量将被调整,以使得这些权向量与当前输入样本的距离缩小。这个过程不断迭代,直至收敛。网络结构:输入层和...转载 2019-04-07 16:00:42 · 9115 阅读 · 2 评论 -
Python数据分析之pandas学习
Python中的pandas模块进行数据分析。接下来pandas介绍中将学习到如下8块内容:1、数据结构简介:DataFrame和Series2、数据索引index3、利用pandas查询数据4、利用pandas的DataFrames进行统计分析5、利用pandas实现SQL操作6、利用pandas进行缺失值的处理7、利用pandas实现Excel的数据透视表功能8、多层索引的...原创 2019-04-07 22:58:56 · 235 阅读 · 0 评论 -
python利用joblib保存训练模型
在机器学习中我们训练模型后,需要把模型保存到本地,这里我们采用joblib来保存from sklearn.externals import joblib#保存训练模型def Save_Model(self, model, filepath): joblib.dump(model, filename=filepath)def Decision_Tree_classifie...原创 2019-04-09 21:11:45 · 962 阅读 · 0 评论 -
python库--pandas--Series.str--字符串处理
S: Series I: Index方法 返回值 参数 说明 .capitalize() S/I 将Series/Index中的字符串大写 .cat() S/I/str 使用给定分隔符连接字符串 other=None None: 使用sep连接给定的Series返回一个str List_like: 与Series对...原创 2019-04-14 16:23:38 · 626 阅读 · 1 评论 -
pyecharts画图
有时我们会很希望把数据展示在地图上,来做数据可视化,使数据更加清晰明了,可谓一图胜百文。先说说我用地图做什么了:微信好友全国分布,显示票房省份数据,全国评分显示等等,我这个语言能力很是头疼啊,进入正题吧!在使用地图前需要安装一下适合自己的地图包:要记得安装对应的地图拓展:选择自己需要的安装$ pip install echarts-countries-pypkg$ pip i...转载 2019-04-25 11:21:52 · 761 阅读 · 0 评论