python
X_dmword
数据与生活同在
展开
-
Python数据抽样
1、数据的导入查看参考参考import pandas as pdf = open("E:/test.csv", encoding="utf-8")content = pd.read_csv(f,nrows=5) ##打印(读取)前5行print(content)##等价 print(content[0:5])左闭右开,输出0-4序号行import pandas ...原创 2019-03-20 17:10:10 · 2693 阅读 · 0 评论 -
Python数据清洗
1、缺失值的处理准备:pandas、numpy、sklearn.preprocessing中的Imputer类import pandas as pdimport numpy as npfrom sklearn.preprocessing import Imputerdata = pd.DataFrame(np.random.randn(6, 4), columns=['col1'...原创 2019-03-17 12:14:38 · 965 阅读 · 0 评论 -
python小笔记(2)
1、range和yieldrange:range([start,] stop[, step]),根据start与stop指定的范围以及step设定的步长,生成一个序列。yield:创建生成器,产生值,类似return,不过函数不会因为yield而结束,只是将流程控制权转交给函数调用者。for i in range(3): print(i) for j in range(0...原创 2018-06-04 19:45:11 · 245 阅读 · 0 评论 -
python小笔记(1)
——致初学python的小白,高手请忽略,哈哈1、format(格式化函数)##代码print('{:<15}'.format('hello word!'))#左对齐print('{:^15}'.format('hello word!'))#居中print('{:>15}'.format('hello word!'))#右对齐print('{:@>15}'.fo...原创 2018-06-04 15:48:17 · 343 阅读 · 0 评论 -
Python数据的相关性和标准化
1、相关性分析协方差:Cov(X,Y)=E(XY)-E(X)E(Y) 或cov(X, Y) = E(X-EX)(Y-EY),表示两个变量总体误差的期望,范围在负无穷到正无穷。协方差为0时,两者独立。协方差绝对值越大,两者对彼此的影响越大,反之越小公式简单翻译一下是:如果有X,Y两个变量,每个时刻的“X值与其均值之差”乘以“Y值与其均值之差”得到一个乘积,再对这每时刻的乘积求和并求出均值(...原创 2019-03-21 20:37:39 · 3745 阅读 · 0 评论 -
python、pycharm、anaconda区别
1、pythonpython自身缺少numpy、matplotlib、scipy、scikit-learn....等一系列包,需要我们安装pip来导入这些包才能进行相应运算(python3.5自带了get-pip.py,不需额外下载安装),在cmd终端输入:pip install numpy就能安装numpy包了。每次都额外安装所需要的包略麻烦,这时候我们可以采用anaconda了。2、A...原创 2019-03-27 16:47:09 · 8295 阅读 · 0 评论 -
Python图形
Gallery页面中有上百幅缩略图,打开之后都有源程序。因此如果你需要绘制某种类型的图,只需要在这个页面中浏览/复制/粘贴一下,基本上都能搞定。https://python-graph-gallery.com/all-charts/1、折线图import matplotlib.pyplot as pltimport numpy as np# 绘制折线图squares ...原创 2019-03-27 17:59:11 · 1046 阅读 · 0 评论