数据分析与可视化分析
文章平均质量分 88
数据分析与可视化分析
瑞 新
求职中 • Java全栈养成计划
公众号 • 让我遇见相似的灵魂
回复领取:竞赛 书籍 项目 面试
左手代码,右手吉他,这就是天下:如果有一天我遇见相似的灵魂 那它肯定是步履艰难 不被理解 喜黑怕光的。如果可以的话 让我触摸一下吧 它也一样孤独得太久。 不一样的文艺青年,不一样的程序猿。
展开
-
【数据分析与可视化】2023最新Python数据分析入门与实践
文章目录实验环境的搭建以上目录是章节目录实验环境的搭建Jupyter-notebook的使用演示原创 2020-05-10 00:02:59 · 8602 阅读 · 40 评论 -
【数据分析可视化】病毒传播-随笔
# 基础import numpy as npimport pandas as pdfrom pandas import DataFrame, Seriesfrom datetime import datetimeimport jsonimport warningswarnings.filterwarnings('ignore')# 忽略python运行过程中的警告# 可视化import matplotlib.pyplot as pltimport se...原创 2020-05-24 16:45:55 · 1148 阅读 · 0 评论 -
【数据分析可视化】班级成绩-pf随笔
文章目录全部9全部9原创 2020-05-24 16:36:24 · 2984 阅读 · 0 评论 -
【数据分析可视化】用python分析了5000部票房,发现赚钱的电影都有这些特征~
1、采集数据# 基础import numpy as npimport pandas as pdfrom pandas import DataFrame, Seriesfrom datetime import datetimeimport jsonimport warningswarnings.filterwarnings('ignore')# 忽略python运行过程中的警告# 可视化import matplotlib.pyplot as pltimport seaborn as s原创 2020-05-14 21:59:30 · 6030 阅读 · 11 评论 -
【数据分析可视化】各国商店-小试牛刀
分组+plt各国商店-小试牛刀# 基本信息import numpy as npimport pandas as pdfrom pandas import Series, DataFrame# 股票数据读取import pandas_datareader as pdr# 可视化import matplotlib.pyplot as pltimport seaborn as sns#%matplotlib inline# timefrom datetime import da.原创 2020-05-10 11:54:32 · 2511 阅读 · 0 评论 -
【数据分析可视化】股票市场分析实战之风险分析
# 基本信息import numpy as npimport pandas as pdfrom pandas import Series, DataFrame# 股票数据读取import pandas_datareader as pdr# 可视化import matplotlib.pyplot as pltimport seaborn as sns#%matplotlib inline# timefrom datetime import datetime# 读取本地数据al原创 2020-05-10 00:00:49 · 1707 阅读 · 4 评论 -
【数据分析与可视化】股票市场分析实战之历史趋势分析
# 基本信息import numpy as npimport pandas as pdfrom pandas import Series, DataFrame# 股票数据读取import pandas_datareader as pdr# 可视化import matplotlib.pyplot as pltimport seaborn as sns#%matplotlib inline# timefrom datetime import datetimestart = dat原创 2020-05-09 19:35:39 · 1519 阅读 · 2 评论 -
【数据分析可视化】 股票市场分析实战之数据获取
股票数据来源雅虎数据抓取安装抓取环境https://github.com/pydata/pandas-datareaderpip下载pip install pandas-datareader可以不通过命令直接安装bin/conda install pandas_datareader使用datareader获取雅虎```import pandas_datareader as pdrpdr.get_data_fred(‘GS10’)## 数据预览```pythoni原创 2020-05-09 16:29:59 · 2130 阅读 · 8 评论 -
【数据分析可视化】实战准备-数据收集
获取数据是首要主动获取-爬虫被动微博 推特股票API:雅虎谷歌其他数据来源国外数据集合kaggle 数据+教程谷歌亚马逊原创 2020-05-09 15:36:42 · 1147 阅读 · 8 评论 -
【数据分析可视化】seaborn强大的调色功能
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltdef sinplot(): x = np.linspace(0, 14, 100) # 设置画布大点 plt.figure(figsize=(8,6)) for i in range(4): plt.plot(x, np.sin(x+i) * (i+0.75), label='sin(x+%s)*(%s+0.75)'原创 2020-05-08 23:53:39 · 962 阅读 · 1 评论 -
【数据分析与可视化】seaborn图形显示效果的设置
import numpy as npimport pandas as pdimport matplotlib.pyplot as plt# 100位的等差数列x = np.linspace(0,14,100)y1 = np.sin(x)y2 = np.sin(x+2)*1.25# 默认画图def sinplot(): plt.plot(x,y1) plt.plot(x,y2)sinplot()import seaborn as sns主题参数sns.axe原创 2020-05-08 21:14:02 · 2107 阅读 · 0 评论 -
【数据分析与可视化】seaborn实现柱状图和热力图
在线加载数据https://github.com/mwaskom/seaborn解决数据不存在【解决sns加载数据报错】sns.load_dataset(“xxx”)报错热力图import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom pandas import Series, DataFrame# 获取在线数据df = sns.load_datase原创 2020-05-08 18:19:59 · 1601 阅读 · 0 评论 -
【解决sns加载数据报错】sns.load_dataset("xxx")报错
路人神对话为什么别人是这样的?我是这样的?我也要做别人家眼中的亚子啊!!!原因发现我的seaborn-data里面是空的(没有那些库文件数据,就当然加载不出来)一顿操作猛如虎github去下载这个seaborn-data,然后解压将文件拖进我的电脑seaborn-data的空文件里即可。guthub链接地址如何在github找到下载seaborn-data并快速下载?什么?你...原创 2020-05-08 14:10:54 · 4194 阅读 · 1 评论 -
【数据分析可视化】seaborn实现直方图和密度图
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom pandas import Series, DataFrame%matplotlib inline# 引入import seaborn as sns/Users/bennyrhys/opt/anaconda3/lib/python3.7...原创 2020-05-08 11:49:16 · 2403 阅读 · 0 评论 -
【数据分析可视化】seaborn介绍
import numpy as npimport pandas as pdimport matplotlib.pyplot as plt import seaborn as sns%matplotlib inline/Users/bennyrhys/opt/anaconda3/lib/python3.7/importlib/_bootstrap.py:219: RuntimeWarni...原创 2020-05-08 09:24:22 · 1107 阅读 · 2 评论 -
【数据分析可视化】饼图、词云
先安装 pip install pyecharts饼图from pyecharts import options as optsfrom pyecharts.charts import PieL1 = ['教授','副教授','讲师','助教','其他']num = [20,30,10,12,8]c = Pie()c.add("",[list(z) for z in zip(...原创 2020-04-30 19:02:12 · 1315 阅读 · 3 评论 -
【数据分析可视化】公式、坐标轴
文章目录公式普通线段图坐标轴import numpy as npimport matplotlib.pyplot as plt%matplotlib inline公式# 公式plt.title('equals',fontsize=15)plt.xlim([1,8])plt.ylim([1,5])plt.text(2,4,r'$ \alpha \beta \pi \lambda ...原创 2020-04-29 12:22:00 · 1678 阅读 · 3 评论 -
【数据分析可视化】复习资料
复指令多训练拿数据看别人的实验在线环境数据测试原创 2020-04-23 20:44:19 · 1051 阅读 · 0 评论 -
【数据分析与可视化】直方图和密度图
import numpy as npimport pandas as pdfrom pandas import Series,DataFrameimport matplotlib.pyplot as plt直方图# randn正态分布s = Series(np.random.randn(1000))# 直方图和柱状图不同(是一个取值范围)plt.hist(s, rwidth=0....原创 2020-04-23 20:22:26 · 2208 阅读 · 0 评论 -
【数据分析与可视化】Pandas绘图之DataFrame
import numpy as npimport pandas as pd import matplotlib.pyplot as pltfrom pandas import Series,DataFramedf = DataFrame( # 范围1~10取40个 np.random.randint(1,10,40).reshape(10,4), columns=...原创 2020-04-23 18:30:11 · 1638 阅读 · 0 评论 -
【数据分析与可视化】Pandas绘图之Series
import numpy as npimport pandas as pdfrom pandas import Series,DataFrameimport matplotlib.pyplot as plt# 生成1000个随机数,并累加s1 = Series(np.random.randn(1000)).cumsum()s2 = Series(np.random.randn(100...原创 2020-04-23 18:02:04 · 1177 阅读 · 1 评论 -
【数据分析与可视化】matplotlib简单绘图之subplot
# 画子图# 导入库import pandas as pdimport numpy as npfrom pandas import Series, DataFrameimport matplotlib.pyplot as plt# 等差数列50个值x = np.linspace(0.0, 5.0)# 生成两个y轴坐标y1 = np.sin(np.pi*x)y2 = np.s...原创 2020-04-23 17:26:36 · 1192 阅读 · 0 评论 -
【数据分析与可视化】Matplotlib简单绘图之plot
文章目录了解常用指令常用函数上手操作plt.show()了解matlab常用指令常用函数绘图在一个figure里面上手操作数据可以只有一组数据两组数据必须长度一致plt.show()以前直接plot()无法显示图像必须调用 plt.show(),因此需引入%matplotlib inline,使plt.plot(a)直接显示图像现在不需要这么麻烦im...原创 2020-04-23 16:33:51 · 2075 阅读 · 0 评论 -
【数据分析与可视化】Matplotlib介绍
文章目录Matplotlib使用场景及特点为什么不用matlab?HelloWorld体验Matplotlib实现画图的架构层面理解其他自学资料Matplotlib使用场景及特点可以辅助Pandas画图,和matlab有点像。也可以3D绘图,但是要引入组件为什么不用matlab?HelloWorld体验Matplotlib实现画图的架构层面理解其他自学资料...原创 2020-04-23 15:40:35 · 1188 阅读 · 0 评论 -
【数据分析可视化】分组和透视功能实战-航班数据分析
import numpy as npimport pandas as pdfrom pandas import Series, DataFrame# 航班数据半个月20w条link = '/Users/bennyrhys/Desktop/数据分析可视化-数据集/homework/usa_flights.csv'df = pd.read_csv(link)df.head() ...原创 2020-04-21 21:09:34 · 2332 阅读 · 1 评论 -
【数据分析可视化】透视表
前提要对数据信息之间的关系要了解import numpy as npimport pandas as pdfrom pandas import Series, DataFrame# 读入excel文件df = pd.read_excel('/Users/bennyrhys/Desktop/数据分析可视化-数据集/homework/sales-funnel.xlsx')df...原创 2020-04-21 19:19:42 · 1251 阅读 · 0 评论 -
【数据分析可视化】数据聚合技术Aggregation
import numpy as npimport pandas as pdfrom pandas import Series, DataFrame# 读入城市天气csv文件df = pd.read_csv('/Users/bennyrhys/Desktop/数据分析可视化-数据集/homework/city_weather.csv')df ...原创 2020-04-20 22:54:26 · 1487 阅读 · 0 评论 -
【数据分析可视化】数据分组技术GroupBy
文章目录理解GroupBy城市天气进行GroupBy操作理解GroupBy类似于数据库分组的GroupBy操作和数据库类似城市天气进行GroupBy操作对group的单个列求平均值是Series对group求平均值返回DataFrameimport numpy as npimport pandas as pdfrom pandas import Series,Data...原创 2020-04-20 22:30:51 · 1725 阅读 · 0 评论 -
【数据分析可视化】数据分箱技术Binning
分箱:抽象理解为苹果根据大小不同分级分箱import numpy as npimport pandas as pdfrom pandas import Series,DataFrame# 模拟成绩分箱score_list = np.random.randint(35, 100, size=20)score_listarray([93, 35, 83, 44, 56, 62,...原创 2020-04-20 21:49:15 · 2078 阅读 · 0 评论 -
【数据分析可视化】时间序列数据的采样和画图
import numpy as npimport pandas as pdfrom pandas import Series,DataFrame# 生成时间索引的Series序列t = pd.date_range('2019-01-01','2019-12-29')tDatetimeIndex(['2019-01-01', '2019-01-02', '2019-01-03', '...原创 2020-04-20 20:46:02 · 1554 阅读 · 0 评论 -
【数据分析可视化】时间序列操作基础
import numpy as npimport pandas as pdfrom pandas import Series,DataFrame# 引入 创建时间序列from datetime import datetimet1 = datetime(2009, 10, 20)t1datetime.datetime(2009, 10, 20, 0, 0)# 列表创建时间序列...原创 2020-04-19 22:55:34 · 978 阅读 · 0 评论 -
【数据分析可视化】通过去重进行数据清洗
import numpy as npimport pandas as pdfrom pandas import Series,DataFrame# 读取刚刚分解处理完的返回数据link_csv = '/Users/bennyrhys/Desktop/数据分析可视化-数据集/homework/demo_duplicate.csv'df = pd.read_csv(link_csv)df...原创 2020-04-19 22:28:11 · 1521 阅读 · 0 评论 -
【数据分析可视化】通过apply进行数据预处理
import numpy as npimport pandas as pdfrom pandas import Series, DataFrame# 读取apply_demo.csv数据link_csv = '/Users/bennyrhys/Desktop/数据分析可视化-数据集/homework/apply_demo.csv'df = pd.read_csv(link_csv).h...原创 2020-04-19 21:59:46 · 1187 阅读 · 0 评论 -
【数据分析可视化】Concatenate和Combine
import numpy as npimport pandas as pdfrom pandas import Series,DataFrameConcatenate矩阵:ConcatenateSeries和DataFrame:concat# 创建矩阵arr1 = np.arange(9).reshape(3,3)arr1array([[0, 1, 2], ...原创 2020-04-19 21:06:49 · 992 阅读 · 0 评论 -
【数据分析可视化】 DataFrame的merge操作
import numpy as npimport pandas as pdfrom pandas import Series, DataFrame# 通过字典,创建两个DataFramedf1 = DataFrame({'data1':[1,2,3,4],'key':['a','b','c','a']})df1 data1 ...原创 2020-04-19 19:48:52 · 1116 阅读 · 0 评论 -
【数据分析可视化】重命名Dataframe的index
import numpy as npimport pandas as pdfrom pandas import Series, DataFrame创建测试的DataFramedf1 = DataFrame(np.arange(9).reshape(3,3), index=[‘BJ’,‘SH’,‘GZ’], columns=[‘A’,‘B’,‘C’])df1<div>...原创 2020-04-19 18:56:24 · 2082 阅读 · 0 评论 -
【数据分析可视化】Series和DataFrame的排序
文章目录Series的排序DataFrame的排序import numpy as npimport pandas as pdfrom pandas import Series, DataFrameSeries的排序s1 = Series(np.random.rand(10))s10 0.3245831 0.5288292 0.9220223 0.05...原创 2020-04-19 16:40:28 · 1350 阅读 · 0 评论 -
【数据分析可视化】DataFrame的简单数学计算
import numpy as npimport pandas as pdfrom pandas import Series, DataFrames1 = Series([1,2,3],index=['A','B','C'])s1A 1B 2C 3dtype: int64s2 = Series([4,5,6,7],index=['B','C','D','E...原创 2020-04-19 15:57:28 · 1537 阅读 · 0 评论 -
【数据分析可视化】Mapping和Replace
DataFrame插入新列,引出Mapimport numpy as npimport pandas as pdfrom pandas import Series, DataFrame# 通过字典创建DataFramedf1 = DataFrame({'城市':['北京','上海','广州'],'人口':[1000,2000,3000]})df1 ...原创 2020-04-18 22:40:32 · 1027 阅读 · 0 评论 -
【数据分析可视化】多级index
import numpy as npimport pandas as pdfrom pandas import Series, DataFrames1 = Series(np.random.rand(6))s10 0.7100421 0.9014242 0.0508023 0.8704864 0.9194965 0.483373dtyp...原创 2020-04-18 22:14:25 · 959 阅读 · 0 评论