数据分析与挖掘
文章平均质量分 64
记录学习之旅
fy_1852003327
2020年3月中旬,由一个博主视频让我开启CSDN之路
记录我的学习中的收获,并与大家分享
每一篇文章都会是倾心倾力,希望大家能指出不足的地方,互相进步,待我成为大牛之时,回首观望我的学习之旅,一路艰辛,我也满脸笑盈。
展开
-
关于pip的一些简单命令及解决pip下载包速度慢的问题
关于pip的一些简单命令及解决pip下载包速度慢的问题【有问题或错误,请私信我将及时改正;借鉴文章标明出处,谢谢】参考文献:Python pip 安装与使用解决pip下载速度慢的问题对于我这个大数据专业的学生,我所学专业,《数据挖掘》、《爬虫技术》、《数据可视化技术》都是所用python语言,python自带的pip工具,不可避免不使用pip,因为它能很便捷的下载你所需要的包。pip是Python包管理工具,该工具提供了对Python包的查找、下载、安装、卸载的功能。Python2.7.9原创 2020-06-09 07:59:39 · 525 阅读 · 0 评论 -
《Python数据分析与挖掘实战》第六章案例代码总结与修改分析
第六章案例代码总结与修改分析【有问题或错误,请私信我将及时改正;借鉴文章标明出处,谢谢】6-1(拉格朗日插值法)代码报错:原因:y = s[list(range(n-k, n)) + list(range(n+1, n+1+k))] #取数修改为:y = s.reindex(list(range(n - k, n)) + list(range(n + 1, n + 1 + k))) # 取数6-2(利用训练样本构建LM神经网络的混淆矩阵及绘制模型的ROC曲线)代码错误:原因:原创 2020-06-06 19:56:50 · 1766 阅读 · 1 评论 -
《Python数据分析与挖掘实战》张良均,第六章电力窃漏电用户自动识别实验学习笔记
一、实验目的1.掌握拉格朗日插值算法进行缺失值处理的方法。2.掌握LM神经网络和CART决策树构建分类模型的方法。二、实验要求1.利用拉格朗日插值算法补全数据用户的用电数据存在的缺失值。对拉格朗日插值法公式的理解,然后参考拉格朗日插值算法进行编程,将数据中的缺失值利用多项式函数对缺失值进行补充2.构建分类模型对窃漏电用户进行识别,两模型为LM神经网络和CART决策树。通过建立模型研究窃漏电用户的行为特征,总结出窃漏电用户的特征指标,对比LM神经网络和CART决策树算法在窃漏电用户的识别效原创 2020-06-02 09:19:17 · 4015 阅读 · 7 评论 -
《Python数据分析与挖掘实战》张良均,第五章学习笔记
第五章 数据建模【有问题或错误,请私信我将及时改正;借鉴文章标明出处,谢谢】第五章相关代码看我的文章:《Python数据分析与挖掘实战》第五章案例代码总结与修改分析经过数据探索与数据预处理,得到了可以直接建模的数据。根据挖掘目标和数据形式可以建立分类与预测、聚类分析、关联规则、时序模式和偏差检测等模型,帮助企业提取数据中蕴含的商业价值,提高企业的竞争力。一、分类与预测分类和预测是预测问题的两种主要类型,分类主要是预测分类标号(离散属性),而预测主要是建立连续值函数模型, 预测给定自变量对应的原创 2020-05-23 08:05:32 · 2973 阅读 · 1 评论 -
《Python数据分析与挖掘实战》张良均,第四章学习笔记
第四章 数据预处理【有问题或错误,请私信我将及时改正;借鉴文章标明出处,谢谢】第四章相关代码看我的文章:《Python数据分析与挖掘实战》第四章案例代码总结与修改分析数据预处理一方面是要提高数据 的质量,另一方面是要让数据更好地适应特定的挖掘技术或工具。数据预处理的主要内容包括数据清洗、数据集成、数据变换和数据规约。一、数据清洗1.缺失值处理(1)缺失值的处理方法分为三类:删除记录、数据插补、和不处理(2)常用的插补方法:①均值/中位数/众数插补:根据属性值的类型,用该属性取原创 2020-05-23 07:20:46 · 1928 阅读 · 0 评论 -
《Python数据分析与挖掘实战》张良均,第二章学习笔记
第2章 Python数据分析简介【有问题或错误,请私信我将及时改正;借鉴文章标明出处,谢谢】一、python的简介Python是一门简单易学且功能强大的编程语言。它拥有高效的高级数据结构,并且能够用简单而又高效的方式进行面向对象编程。Python优雅的语法和动态类型,再结合它的解释性,使其在大多数平台的许多领域成为编写脚本或开发应用程序的理想语言。要认识Python,首先得明确一点,Python是一门编程语言!这就意味着,至少原则上来说,它能够完成Matlab能够做的所有事情(因为大不了从头开原创 2020-05-22 21:08:12 · 1056 阅读 · 0 评论 -
《Python数据分析与挖掘实战》张良均,第一章学习笔记
第一章从餐饮行业来引出数据挖掘【有问题或错误,请私信我将及时改正;借鉴文章标明出处,谢谢】刚开始讲到了T餐饮企业的管理系统(5个管理系统),因为多方面管理系统加强了此企业的信息化管理,提高了工作效率,但是积累的这些大量的历史数据中提取有用的数据需要大量的精力,人力,更重要的是时间上的浪费,在企业的竞争中优胜劣汰,物竞天择,导致最终企业倒闭。那能不能让电脑来解决数据,挖掘有用的数据最后自动分析,从而从数据上提出方案减低企业运营成本、增加盈利能力、实现精准营销、策划促销活动等。从而引出数据挖掘,那企原创 2020-05-22 18:57:16 · 931 阅读 · 0 评论 -
《Python数据分析与挖掘实战》第五章案例代码总结与修改分析
第五章案例代码总结与修改分析【有问题或错误,请私信我将及时改正;借鉴文章标明出处,谢谢】每个案例代码全部为书中源代码,出现错误按照每个案例下面给出的代码错误,原因,及怎样修改进行修改即可解决每个案例错误5-1import pandas as pdfilename = 'F:/大二下合集/Python数据分析与挖掘/bankloan.xls'data = pd.read_excel(filename)x = data.iloc[:,:8].as_matrix()y = data.iloc[:,原创 2020-05-22 12:04:21 · 5057 阅读 · 9 评论 -
《Python数据分析与挖掘实战》第四章案例代码总结与修改分析
第四章案例代码总结与修改分析每个案例代码全部为书中源代码,出现错误按照每个案例下面给出的代码错误,原因,及怎样修改进行修改即可解决每个案例错误4-1#拉格朗日插值代码import pandas as pd #导入数据分析库Pandasfrom scipy.interpolate import lagrange #导入拉格朗日插值函数inputfile = 'F:/大二下合集/Python数据分析与挖掘/catering_sale.xls' #销量数据路径outputfile = 'F:/大二下原创 2020-05-22 11:35:27 · 3090 阅读 · 4 评论 -
《Python数据分析与挖掘实战》第三章案例代码总结与修改分析
第三章案例代码总结与修改分析每个案例代码全部为书中源代码,出现错误按照每个案例下面给出的代码错误,原因,及怎样修改进行修改即可解决每个案例错误3-1#-*- coding: utf-8 -*-import pandas as pdcatering_sale = 'F:/大二下合集/Python数据分析与挖掘/catering_sale.xls' #餐饮数据data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引原创 2020-05-22 11:21:56 · 1643 阅读 · 1 评论 -
windows下安装Keras2.1.4,很详细(cpu版)
安装Keras2.1.4(cpu版)【有问题或错误,请联系qq:1852003327我将及时改正;借鉴文章标明出处,谢谢】准备工作:安装numpy,Scipy,Theano这次安装所用软件的版本:python-3.5.4keras-2.1.4tersorflow-1.5参考文献:○1初学Python者自学Anaconda的正确姿势是什么?○2Windows 安装 Anacond...原创 2020-04-23 21:02:57 · 9540 阅读 · 5 评论