python数据分析篇
主要是数据分析案例和基础知识
鹏鹏写代码
执着勇敢,一如少年!
展开
-
Python将txt数据转换为xls(表格)文件,方便后面做数据分析
Python我们做数据分析的时候有时候获得数据是txt文件,这时候我们该怎么办呢?下面我给大家教一下这时候应该怎么做?1.读取txt数据查看:我们就可以看到使用逗号隔开的数据。"""读取数据,查看数据"""f_path=r'D:\\Python\\airpm25.txt'with open(f_path,encoding = "UTF-8") as f: data=f.read() print(data)运行结果:2.将txt文件转换为xlsx文件,方便后面数据分析等操原创 2020-12-26 15:45:13 · 14919 阅读 · 2 评论 -
基于python的股票数据的读取及可视化(K线图)
文章目录1.读取数据2.绘制股票走势图3.绘制K线图1.读取数据python的强大之处就在于有一帮第三方库的兄弟,股票方面也是如此,今天给大家讲一下这个库,他就是tushare库(官方地址:http://tushare.org/),大家可以直接用pip安装,以Windows安装为例吧。安装过程可以参考我以前的博客:python用命令安装第三方库教程2.绘制股票走势图3.绘制K线图...原创 2020-11-21 20:50:48 · 18573 阅读 · 5 评论 -
基于Python随机森林案例:给别人的爱情把关
案例背景某天,小C的表妹小Q来找小C,说他遇到一点困扰----小Q的同事给她介绍了一个对象Mr.Z,这个人现年37岁,在某省机关做文员工作,但是小Q的择偶标准是需要对方月薪在5w以上,不要说小Q拜金,只因世人都知软饭香,但是现在刚认识没多久,也就不好意思直接问Mr.z,所以拿不动主意要不要和Mr.z深入交往,(说白了就是不知道Mr.z到底有多少钱?),于是想让小C帮忙做一个决策,作为优秀的大数据分析师的小C,小C思忖良久,发现此事并不简单,还需要用到python,还需要搭建模型,于是小C一下子想到了决策原创 2020-11-18 18:34:12 · 757 阅读 · 0 评论 -
python的jieba库和词云图
1.安装第三方库首先要实现中文分词和词云图,先要安装jieba库和wordcloud库,安装截图为jupyter notebook 安装的截图。指令为:pip install wordcloud安装完成截图:pip install jieba安装完成截图:2.中文分词库:jieba中文分词也就是将一句话拆分成一些词语,例如“人生苦短,我学python”,可以拆分成“人生”,“苦短”,“我”,“用”,“python”。我用一个简单的例子,如何用jieba库进行中文分词。import原创 2020-11-04 20:49:56 · 4041 阅读 · 3 评论 -
初级数据分析师-必知
1.数据分析的定义:数据分析的目的是把隐藏的在一大批看似杂乱无章的数据背后的信息集中提炼出来,总结出所研究出的对象的一大批内在规律。数值也称为观测值,通过实验,测量,观察,调查等方式获取结果,常常以数据的形式展现出来;2.数据分析分为广义数据分析和狭义数据分析,广义数据分析包括狭义数据分析和数据挖掘,我们常说的数据分析是指狭义数据分析;3.数据分析(狭义):数据分析是根据分析目的,用适当的分析方法及工具,对数据进行处理和分析,提取有价值的信息,形成有效结论的过程;数据的分析主要实现三大作用:分别是现状原创 2020-07-07 13:38:36 · 600 阅读 · 0 评论 -
Numpy,pandas,Matplotlib三剑问鼎python数据分析
python之如此强大,是因为他的很多工具包,例如数据分析中就涉及三个主要的包,NumPy和pandas和Matplotlib库,其中NumPy和pandas主要就是处理一维以及二维数据,Matplotlib则是数据可视化的利器。一 , NumPy库和数组import numpy as npa = [1,2,3,4] #创建列表ab = np.array([1,2,3,4])#创建数组print(a)print(b)print(type(a))#打印出数据类型print(type(b))原创 2020-08-30 00:28:05 · 962 阅读 · 0 评论 -
基于python的股票客户流失数据分析模型
目录1.案例背景 22. 读取数据 23. 划分特征变量和目标变量 34. 模型的搭建和使用 35. 模型的使用 46. ROC曲线对模型的评估 77.总结 108.参考文献 109.致谢 101.案例背景在进行一笔股票交易时候,交易者(股民)都要给其账户所在的证券公司支付一些手续费,虽然单笔手续费不是很高,但是股票市场的每日都有巨额的成交量,每一笔交易的手续费汇总起来,数量相当可观,这部分收入对于一个证券公司来说非常重要的,甚至有时候可以占到营业总收入的50%以上,因此,证券公司对于原创 2020-10-24 14:27:33 · 2334 阅读 · 1 评论 -
深入浅出数据分析宝典
数据分析真实项目流程明确问题:明确问题是数据分析的第一步,必须明确数据分析真实需求;理解数据:数据获取和数据探索;数据清洗:一个数据分析项目大部分时间花在数据清洗上;数据分析和可视化:对清洗后的数据进行分析,并通过可视化展现出结果;结论和建议:对结果进行解读,得出有价值的结论并提出相关的建议;数据分析的方法:常用的统计方法:例如计算常用统计量和构建相关指标;图表法:通过各种图形结合来展示数据里面信息;机器学习算法:对于复杂的分析,会涉及到模型的构建;深入浅出数据分析数据分析引言:原创 2020-10-19 20:45:20 · 223 阅读 · 0 评论 -
python爬虫基础源代码
1.简单爬取百度网页内容:爬取百度网页源代码:import requestsr=requests.get("http://www.baidu.com")r.status_coder.encodingr.encoding=r.apparent_encodingr.text结果展示:2.爬取网页的通用代码框架:(这里继续选用百度网页)爬取网页的通用代码框架import requestsdef getHTMLText(url): try: r=reques原创 2020-05-12 15:45:07 · 30457 阅读 · 6 评论