- 博客(44)
- 收藏
- 关注
原创 Python回归预测汇总-线性回归(实例:美国波士顿地区房价预测)
本文介绍了机器学习中的线性回归方法,并利用该方法对美国波士顿地区的方法进行了预测。
2020-09-16 15:29:49 4950 3
原创 TypeError: bar() missing 1 required positional argument: ‘x‘
解决问题:TypeError: bar() missing 1 required positional argument: 'x'
2020-09-14 20:16:45 15295 4
原创 利用Python进行数据分析5-时间序列
时间序列(time series)数据是⼀种重要的结构化数据形式,应⽤于多个领域,包括⾦融学、经济学、⽣态学、神经科学、物理学等。与前⾯接触的数据相⽐,时间序列数据要求不同类型的分析和数据转换⼯具。
2020-09-08 19:31:48 2053
原创 Windows下在Anaconda3中安装Python版的XGBoost库(Python 3.7)
在以下网址下载XGBoost库:https://www.lfd.uci.edu/~gohlke/pythonlibs/#xgboost根据自己系统选择相应的文件。我的是win10,64位,anaconda3默认的Python3.7环境,所以我选择的是:XGBoosts-1.1.0-cp37-cp37m-win_amd64.whl。下载之后记住文件的路径,例如我保存的位置是:E:\anaconda。接下来打开anaconda prompt,将路径定位到防止该文件的目录下:接下来开始安装(PS:不要
2020-09-05 15:09:58 328
原创 InvocationException: GraphViz‘s executables not found&&InvocationException: Program terminated with
通过pip安装了GraphViz模块后,当在决策树算法中显示决策树时出现错误:InvocationException: GraphViz’s executables not found此时我们需要下载安装GraphViz(这是一个独立软件)网址:https://graphviz.org/download/点击下图第三行链接:Stable Windows install packages点击找到下图路径:之后点击下载,下载后解压。记住下载存储的路径,将GraphViz安装目录的bin目录放到环
2020-09-04 21:01:09 425
原创 利用Python进行数据分析4-绘图与可视化
本篇的⽬的是熟悉⼀些基本的数据可视化操作,使⽤pandas,matplotlib,和seaborn。如果视觉显示数据分析的结果对你的⼯作很重要,我⿎励你寻求更多的资源来了解更⾼效的数据可视化。
2020-09-04 16:04:20 2745
原创 jupyter notebook更改默认路径-改为自己想要的路径
step1:在anaconda自带的终端手动生成jupyter notebook --generate-config.py文件step2:在C盘用户目录下找到…jupyter文件夹里面就有刚才生成的文件step3:用记事本打开该文件找到#c.NotebookApp.notebook_dir = ''这一行,将需要的路径写上去c.NotebookApp.notebook_dir =‘需要的路径’,记得去掉前面的#。step4:添加环境变量(以win10为例):此电脑→右键→属性→更改设置→高级→环
2020-09-02 18:42:02 1352
原创 Exception:jupyter command ‘jupyter-contrib‘not found
今天配置jupyter notebook时出现错误提示:Exception:jupyter command 'jupyter-contrib’not found运行完jupyter contrib nbextension install --user之后出现该错误,最后发现只需要将命令改为jupyter contrib-nbextension install --user因为我们安装的是jupyter-contrib-nbextension而不是jupyter-contrib。...
2020-09-02 16:37:51 1490 2
原创 AttributeError: ‘str‘ object has no attribute ‘shape‘
出现错误:AttributeError: ‘str’ object has no attribute ‘shape’解决方案:将后面的result改为result.array
2020-08-12 13:12:32 11986
原创 利用Python进行进行数据分析3-数据规整之聚合、合并和重塑
在许多应⽤中,数据可能分散在许多⽂件或数据库中,存储的形式也不利于分析。本文关注可以聚合、合并、重塑数据的⽅法。
2020-08-12 13:09:46 418
原创 WARNING: You are using pip version 20.1.1; however, version 20.2.1 is available. You should consider
出现警告:解决方案:python -m pip install --upgrade pip
2020-08-12 11:23:28 681
原创 AttributeError:Can only use .str accessor with string values!
修改之前:出现错误:意为matches不是字符串则使用此方法错误修改方法:将最后两行代码改为:
2020-07-19 15:13:47 35143 3
原创 利用Python进行数据分析2-数据清洗和准备
在数据分析和建模的过程中,相当多的时间要⽤在数据准备上:加载、清理、转换以及重塑。pandas和内置的Python标准库提供了⼀组⾼级的、灵活的、快速的⼯具,可以让你轻松地将数据规变为想要的格式。
2020-07-16 21:35:57 1188
原创 利用Python进行数据分析1-数据加载,存储与文件格式
访问数据是数据分析的第一步,本文着重介绍pandas的数据输⼊与输出,虽然别的库中也有不少以此为⽬的的⼯具。输⼊输出通常可以划分为⼏个⼤类:读取⽂本⽂件和其他更⾼效的磁盘存储格式,加载数据库中的数据,利⽤Web API操作⽹络资源。
2020-07-14 16:33:20 840 1
原创 数据分析3-电信行业用户流失预测实例
本文介绍了包括无关数据的删除,数据标准化,箱线图的绘制,替换值,编码;构建模型(划分数据集,选择训练模型,评估模型);利用选择的模型预测数据;以及得出结论。
2020-07-05 11:52:05 1177
原创 数据分析2-电信行业用户流失预测实操
本文衔接上一篇博客介绍了对电信行业用户流失数据提取特征(离散特征-LabelEncoder编码,OneHotEncoder编码);相关性分析(相关性矩阵,热图,散点矩阵图,条形图相关性分析)
2020-06-27 21:51:10 663
原创 数据分析1-电信行业用户流失预测实操
本文介绍了对电信行业用户流失数据进行数据分析,进行了数据介绍,导入数据,查看数据信息;并进行了数据处理(查看,处理缺失值,查看,转换数据类型,数据归一化);数据可视化(数据占比,各字段对客户流失量的影响)
2020-06-27 21:43:56 983
原创 Python分类算法汇总-支持向量机分类算法(鸢尾花作为实例)
本文介绍了支持向量机分类算法,详细的介绍了其原理,函数,以及利用该算法预测鸢尾花数据。
2020-06-22 16:02:56 4907 3
原创 Python分类算法汇总-K最近邻分类算法(鸢尾花分类与预测)
本文介绍了k最近邻分类算法的原理,思路,以及简要的介绍了各种距离的公式,最后利用该算法对鸢尾花数据进行分类预测。
2020-06-11 12:53:07 1773
原创 Python分类算法汇总-随机森林算法(鸢尾花实例)
本文介绍了随机森林算法的原理,算法所用函数。由于该算法是多棵决策树而成的一个分类器具体说明可以参考我的文章(决策树算法)。并用鸢尾花数据作为实例进行实战。
2020-06-09 13:33:29 9188 1
原创 Python分类算法汇总-决策树算法(鸢尾花数据分类与预测)
本文详细介绍了决策树算法的原理,构造,交叉验证等知识点。并通过鸢尾花数据集进行了决策树算法的分类与预测,对算法的函数用法进行了详细的介绍。
2020-06-09 12:12:16 4395
原创 Python爬虫-正则表达式介绍&&实战
正则表达式对于爬虫的使用有巨大的作用,需要深入了解。本文介绍了正则表达式的常用操作符,函数,并且附有代码操作便于学习。
2020-06-06 12:18:43 133
原创 Python-基于ARIMA模型股票趋势预测
本文利用ARIMA模型(自回归移动平均模型),(是统计模型中最常见的一种用来进行时 间序列预测的模型。)预测了股票趋势。
2020-06-04 13:14:51 5997 9
原创 Python爬虫-爬虫能做什么
1.采集网络数据数据的作用:聚合产品(新闻网站,早期的今日头条)搜索引擎(百度,谷歌)数据分析,人工智能的源数据特定领域的数据服务(二手车估价,天气预报,团购)2.自动化测试请求网络接口,验证数据3.做一些脱离手动的操作1.帮人投票2.12306抢票3.微信聊天助手-itchat)4.灰产业薅羊毛:eg前段时间的拼夕夕bug事件网络攻击:控制电脑访问网站,使得网站瘫痪水军:程序控制账号控制言论...
2020-05-28 16:40:41 185 1
原创 Python爬虫-信息标记与提取
本文介绍了信息标记的三种形式,信息的标记,信息提取的一般方法(附代码)bs4库的HTML内容查找方法(附代码,可运行)
2020-05-20 09:33:08 339
原创 Python爬虫-Beautiful Soup库入门
本文介绍了BeautifulSoup库的安装,基本要素(包括代码使用),基于bs4库的HTML内容三种遍历方法(上行遍历,下行遍历,平行遍历)(包括遍历代码 ,均可运行),还有基于bs4库的HTML的格式化和编码(包含代码 可运行)
2020-05-19 12:01:01 149
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人