自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 Python图形

Gallery页面中有上百幅缩略图,打开之后都有源程序。因此如果你需要绘制某种类型的图,只需要在这个页面中浏览/复制/粘贴一下,基本上都能搞定。https://python-graph-gallery.com/all-charts/1、折线图import matplotlib.pyplot as pltimport numpy as np# 绘制折线图squares ...

2019-03-27 17:59:11 1049

原创 python、pycharm、anaconda区别

1、pythonpython自身缺少numpy、matplotlib、scipy、scikit-learn....等一系列包,需要我们安装pip来导入这些包才能进行相应运算(python3.5自带了get-pip.py,不需额外下载安装),在cmd终端输入:pip install numpy就能安装numpy包了。每次都额外安装所需要的包略麻烦,这时候我们可以采用anaconda了。2、A...

2019-03-27 16:47:09 8297

原创 Python数据的相关性和标准化

1、相关性分析协方差:Cov(X,Y)=E(XY)-E(X)E(Y) 或cov(X, Y) = E(X-EX)(Y-EY),表示两个变量总体误差的期望,范围在负无穷到正无穷。协方差为0时,两者独立。协方差绝对值越大,两者对彼此的影响越大,反之越小公式简单翻译一下是:如果有X,Y两个变量,每个时刻的“X值与其均值之差”乘以“Y值与其均值之差”得到一个乘积,再对这每时刻的乘积求和并求出均值(...

2019-03-21 20:37:39 3746

原创 Python数据抽样

1、数据的导入查看参考参考import pandas as pdf = open("E:/test.csv", encoding="utf-8")content = pd.read_csv(f,nrows=5) ##打印(读取)前5行print(content)##等价 print(content[0:5])左闭右开,输出0-4序号行import pandas ...

2019-03-20 17:10:10 2695

原创 人工智能与数据挖掘

作为一个IT人,区分理解人工智能、机器学习、表示学习、深度学习、数据挖掘等是很有必要的~~~1、人工智能是机器或软件展示出的智能,也是研究如何让计算机或计算机软件有智能行为的一个学术领域,主要研究的是如何模拟和扩展人类的 智能。人工智能所涉及的范围甚广,例如自然语言处理、图像识别、语音识别等。人工智能分类:强人工智能和弱人工智能。前者是通过计算机来构造复杂的、拥有与人类智慧同样本质特性的机...

2019-03-18 15:33:52 15757

原创 决策树算法的研究

先来一段决策树相关的小故事:文献:周志华.机器学习[M].北京:清华大学出版社,2016: -最初的决策树算法是心理学家兼计算机科学家E.B.Hunt 1962年在研究人类的概念学习过程时提出的CLS(Concept Learning System),这个算法确立了决策树“分而治之”的学习策略。罗斯·昆兰在Hunt的指导下于1968年在美国华盛顿大学获得计算机博士学位,然后到悉尼大学任教...

2019-03-18 15:32:49 2140

原创 决策树划分与剪枝

1、决策树划分选择决策树学习的关键——如何选择最优划分属性。我们所期望的是,随着划分过程的不断进行,希望决策树的分支结点所包含的的样本尽可能属于同一类别,即结点的“纯度”要尽可能的高。1.1 信息增益要说信息增益,我们先来了解一下信息熵。“信息熵“是度量样本集合纯度最常用的一种指标。假设当前样本集合D中第k类样本所占的比例为,则D的信息熵定义为: ...

2019-03-18 15:31:52 895

原创 Python数据清洗

1、缺失值的处理准备:pandas、numpy、sklearn.preprocessing中的Imputer类import pandas as pdimport numpy as npfrom sklearn.preprocessing import Imputerdata = pd.DataFrame(np.random.randn(6, 4), columns=['col1'...

2019-03-17 12:14:38 969

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除