2019年03月_X_dmword

原创 Python图形

Gallery页面中有上百幅缩略图，打开之后都有源程序。因此如果你需要绘制某种类型的图，只需要在这个页面中浏览/复制/粘贴一下，基本上都能搞定。https://python-graph-gallery.com/all-charts/1、折线图import matplotlib.pyplot as pltimport numpy as np# 绘制折线图squares ...

2019-03-27 17:59:11 1049

原创 python、pycharm、anaconda区别

1、pythonpython自身缺少numpy、matplotlib、scipy、scikit-learn....等一系列包，需要我们安装pip来导入这些包才能进行相应运算（python3.5自带了get-pip.py，不需额外下载安装），在cmd终端输入：pip install numpy就能安装numpy包了。每次都额外安装所需要的包略麻烦，这时候我们可以采用anaconda了。2、A...

2019-03-27 16:47:09 8297

原创 Python数据的相关性和标准化

1、相关性分析协方差：Cov(X，Y)=E(XY)-E(X)E(Y) 或cov(X, Y) = E(X-EX)(Y-EY)，表示两个变量总体误差的期望，范围在负无穷到正无穷。协方差为0时，两者独立。协方差绝对值越大，两者对彼此的影响越大，反之越小公式简单翻译一下是：如果有X,Y两个变量，每个时刻的“X值与其均值之差”乘以“Y值与其均值之差”得到一个乘积，再对这每时刻的乘积求和并求出均值（...

2019-03-21 20:37:39 3746

原创 Python数据抽样

1、数据的导入查看参考参考import pandas as pdf = open("E:/test.csv", encoding="utf-8")content = pd.read_csv(f,nrows=5) ##打印（读取）前5行print(content)##等价 print(content[0:5])左闭右开，输出0-4序号行import pandas ...

2019-03-20 17:10:10 2695

原创人工智能与数据挖掘

作为一个IT人，区分理解人工智能、机器学习、表示学习、深度学习、数据挖掘等是很有必要的~~~1、人工智能是机器或软件展示出的智能，也是研究如何让计算机或计算机软件有智能行为的一个学术领域，主要研究的是如何模拟和扩展人类的智能。人工智能所涉及的范围甚广，例如自然语言处理、图像识别、语音识别等。人工智能分类：强人工智能和弱人工智能。前者是通过计算机来构造复杂的、拥有与人类智慧同样本质特性的机...

2019-03-18 15:33:52 15757

原创决策树算法的研究

先来一段决策树相关的小故事：文献：周志华.机器学习[M].北京：清华大学出版社，2016: -最初的决策树算法是心理学家兼计算机科学家E.B.Hunt 1962年在研究人类的概念学习过程时提出的CLS（Concept Learning System），这个算法确立了决策树“分而治之”的学习策略。罗斯·昆兰在Hunt的指导下于1968年在美国华盛顿大学获得计算机博士学位，然后到悉尼大学任教...

2019-03-18 15:32:49 2140

原创决策树划分与剪枝

1、决策树划分选择决策树学习的关键——如何选择最优划分属性。我们所期望的是，随着划分过程的不断进行，希望决策树的分支结点所包含的的样本尽可能属于同一类别，即结点的“纯度”要尽可能的高。1.1 信息增益要说信息增益，我们先来了解一下信息熵。“信息熵“是度量样本集合纯度最常用的一种指标。假设当前样本集合D中第k类样本所占的比例为，则D的信息熵定义为： ...

2019-03-18 15:31:52 895

原创 Python数据清洗

1、缺失值的处理准备：pandas、numpy、sklearn.preprocessing中的Imputer类import pandas as pdimport numpy as npfrom sklearn.preprocessing import Imputerdata = pd.DataFrame(np.random.randn(6, 4), columns=['col1'...

2019-03-17 12:14:38 969

X_dmword的博客