数据分析
光明顶上的5G
作者5G,目前专注于Java后端技术的学习
展开
-
pandas入门
目录pandas基本介绍pandas选择数据pandas设置值pandas合并concatpandas合并mergepandas plot作图pandas基本介绍import pandas as pdimport numpy as nps = pd.Series([1,3,6,np.nan,44,1])print(s)# 0 1.0# ...原创 2019-05-11 10:00:00 · 621 阅读 · 0 评论 -
matplotlib入门(三)
目录subplot多合一显示subplot分格显示图中图次坐标轴Animation动画subplot多合一显示import matplotlib.pyplot as pltplt.figure()plt.subplot(2,1,1)plt.plot([0,1],[0,1])plt.subplot(2,3,4)plt.plot([0,1],[0,2]...原创 2019-05-09 15:52:56 · 253 阅读 · 0 评论 -
matplotlib入门(二)
scatter散点图import matplotlib.pyplot as pltimport numpy as npn = 1024X = np.random.normal(0,1,n)Y = np.random.normal(0,1,n)T = np.arctan2(Y,X) #for color valueplt.scatter(X,Y,s=75,c=T,alpha=0...原创 2019-05-09 10:58:19 · 174 阅读 · 0 评论 -
matplotlib入门(一)
基本用法import matplotlib.pyplot as pltimport numpy as npx = np.linspace(-3,3,50)y1=2*x+1y2=x**2plt.plot(x,y1)plt.show()figure图像import matplotlib.pyplot as pltimport numpy as npx = np.l...原创 2019-05-09 09:53:36 · 190 阅读 · 0 评论 -
numpy
ndarray,numpy常用Array#encoding=utf-8import numpy as npdef main(): lst=[[1,3,5],[2,4,6]] print(type(lst)) np_lst=np.array(lst) print(type(np_lst)) np_lst=np.array(lst,dtype=np...原创 2019-05-05 21:52:17 · 275 阅读 · 0 评论 -
天池-幸福感学习过程
import pandas as pdimport numpy as npfrom sklearn.metrics import mean_squared_errorimport lightgbm as lgbimport xgboost as xgbfrom sklearn.model_selection import train_test_splitfrom sklearn.pre...原创 2019-11-28 14:40:18 · 744 阅读 · 0 评论 -
matplotlib中各种图形参数解释
柱状图bar的使用matplotlib.pyplot.bar(left, height, alpha=1, width=0.8, color=, edgecolor=, label=, lw=3)left: x轴的位置序列,一般采用range函数产生一个序列,但是有时候可以是一个字符串height: y轴的数值序列,也就是柱形图的高度,一般就是我们需要显示的数据alpha: 透明度,值越...原创 2019-11-25 21:55:31 · 7858 阅读 · 1 评论 -
pandas清洗脏数据
准备工作pip install pandasimport pandas as pddata = pd.read_csv('..//data/tmdb_5000_credits.csv')检查数据data.head() # 打印输出前五行数据查看一列的一些基本统计信息:data.columnname.describe()选择一列:data['columnname']选择一...原创 2019-09-22 23:12:03 · 463 阅读 · 0 评论