自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(33)
  • 收藏
  • 关注

转载 决策树

熵条件熵经验熵 经验条件熵相对熵 互信息决策树 (Decision Tree)ID3 信息增益 (容易过拟合)计算信息增益选择信息增益最大的特征作为当前的分裂特征例子C4.5 信息增益比以信息增益 作为划分训练...

2017-04-10 12:43:00 122

转载 python基础2 -画图

#!/usr/bin/env python# -*- coding: utf-8 -*-# Created by xuehz on 2017/4/9import numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltfrom scipy.stats import norm, poissoni...

2017-04-09 14:05:00 224

转载 python基础1

Numpy提供了ndarrayarange/linspace/logspace整数/布尔数组存取二维数组的切片元素去重stack and axis链接两个narange#!/usr/bin/env python# -*- coding: utf-8 -*-# Created by xuehz on 2017/3/28import numpy as npif ...

2017-04-09 12:36:00 133

转载 如何实现用户的历史记录功能(最多n条)

转载于:https://www.cnblogs.com/xuehaozhe/p/ru-he-shi-xian-yong-hu-de-li-shi-ji-lu-gong-neng-z.html

2017-04-08 14:41:00 289

转载 如何让字典保持有序

python 默认字典 不具有 有序性使用有序字典转载于:https://www.cnblogs.com/xuehaozhe/p/ru-he-rang-zi-dian-bao-chi-you-xu.html

2017-04-08 14:27:00 62

转载 如何快速找到多个字典中的公共键(key)

普通方法每轮都有进球的球员(公共键)方法1转载于:https://www.cnblogs.com/xuehaozhe/p/ru-he-kuai-su-zhao-dao-duo-ge-zi-dian-zhong-de-gon.html...

2017-04-08 14:14:00 105

转载 如何根据字典中值的大小, 对字典中的项排序

方法1方法2转载于:https://www.cnblogs.com/xuehaozhe/p/ru-he-gen-ju-zi-dian-zhong-zhi-de-da-xiao-dui-zi-d.html

2017-04-07 22:46:00 426

转载 如何统计序列中元素的出现频度

普通方法from random import randintdata = [randint(0,20) for _ in xrange(30)]c = dict.fromkeys(data,0) #0 为初始值for x in data: c[x] + =1sorted(c.iteritems(), key=lambda x: x[1], reverse=T...

2017-04-07 21:45:00 68

转载 如何为元组中的每个元素命名, 提高程序可读性

方法转载于:https://www.cnblogs.com/xuehaozhe/p/ru-he-wei-yuan-zu-zhong-de-mei-ge-yuan-su-ming-min.html

2017-04-07 15:02:00 119

转载 如何在列表, 字典, 集合中根据条件筛选数据

解决办法:列表 方法1列表解析 方法2字典解析集合解析转载于:https://www.cnblogs.com/xuehaozhe/p/ru-he-zai-lie-biao-zi-dian-ji-he-zhong-gen-ju-tiao.html...

2017-04-07 14:53:00 96

转载 如何去掉字符串中不需要的字符

方法1方法2方法3改进版本(因为上面的方法只能替换一个符号)方法4两种 translate()方法string下的translate()转变 a > x b > y c > z构建映射表结果上述 table 若为None 说明不做任何的映射 第二个参数 表示 要删...

2017-03-31 20:32:00 1318

转载 如何对字符串进行左, 右, 居中对齐

方法1方法2问题解决方法转载于:https://www.cnblogs.com/xuehaozhe/p/ru-he-dui-zi-fu-chuan-jin-xing-zuo-you-ju-zhong-du.html

2017-03-31 19:40:00 402

转载 如何将多个小字符串拼接成一个大的字符串

方法1出现问题资源浪费方法2若字符串中 有数字 可以使用 列表解析 更完美的方法 是 使用生成器 ( )转载于:https://www.cnblogs.com/xuehaozhe/p/ru-he-jiang-duo-ge-xiao-zi-fu-chuan-pin-jie-cheng-.html...

2017-03-31 10:17:00 226

转载 如何调整字符串中文本格式

方法 正则表达式 捕获组转载于:https://www.cnblogs.com/xuehaozhe/p/ru-he-diao-zheng-zi-fu-chuan-zhong-wen-ben-ge-shi.html

2017-03-30 12:22:00 89

转载 如何判断字符串a是否以字符串b开头或结尾

查看权限修改权限转载于:https://www.cnblogs.com/xuehaozhe/p/ru-he-pan-duan-zi-fu-chuana-shi-fou-yi-zi-fu-chuan.html

2017-03-30 12:06:00 239

转载 如何拆分含有多种分隔符的字符串

In [6]: sOut[6]: 'www 1227 0.0 0.0 15572 2096 pts/2 R+ 10:29 0:00 ps aux'In [8]: s.split?Docstring:S.split([sep [,maxsplit]]) -> list of stringsReturn a list of the ...

2017-03-30 11:52:00 126

转载 Pandas的时间序列处理

创建from datetime import datetimeimport pandas as pdimport numpy as np# 指定index为datetime的listdate_list = [datetime(2017, 2, 18), datetime(2017, 2, 19), datetime(2017, 2, 25)...

2017-03-17 19:53:00 93

转载 偏差与方差

偏差-方差分解 试图对学习算法的 期望泛化错误率 进行分解。测试样本 x\(y_D\)为 x 在数据集中标记y为x的真实标记f(x;D)为训练集D上学得模型f 在x上的预测输出学习算法的期望预测:偏差 方差 噪声 含义偏差:描述的是预测值(估计值)的期望与真实值之间的差距。偏差越大,越偏离真实数据,如下图第二行所示。方差:描述的是预测值的...

2017-03-17 16:02:00 91

转载 可视化高峰数据

matplotlib 数据可视化图像中文字体数据集存在的问题#!/usr/bin/env python# -*- coding: utf-8 -*-# Created by xuehz on 2017/3/16import pandas as pdimport matplotlib.pyplot as pltfrom matplotlib impor...

2017-03-16 23:45:00 151

转载 数据可视化- bokeh

from bokeh.io import output_notebook, output_file, showfrom bokeh.charts import Scatter, Bar, BoxPlot, Chordfrom bokeh.layouts import rowimport seaborn as sns# 导入数据exercise = sns.l...

2017-03-16 19:30:00 111

转载 数据可视化-Seaborn

单变量分布x1 = np.random.normal(size=1000)sns.distplot(x1);直方图sns.distplot(x1, bins=20, kde=False, rug=True)核密度估计sns.distplot(x2, hist=False, rug=True)sns.kdeplot(x2, ...

2017-03-16 18:54:00 154

转载 数据可视化-matplotlib

figure /subplot# 创建figurefig = plt.figure()ax1 = fig.add_subplot(2,2,1)ax2 = fig.add_subplot(2,2,2)ax3 = fig.add_subplot(2,2,3)ax4 = fig.add_subplot(2,2,4)直方图、...

2017-03-16 16:23:00 132

转载 时间复杂度排序

当 n 大于100 nn > n100 n > e , en < nn en = e * e * ... * en! = n* n-1 * n-2 * ... *2 *1nn = n * n * n ... *n所以 nn > n! > en > n100转载于:https://www.cnblogs.com/xue...

2017-03-16 14:26:00 87

转载 模型评估的性能度量

回归问题常用均方误差分类问题错误率与精度其中 m 为样本的个数查准率、查全率、F1对于二分问题:P-R曲线A优于C(A完全‘包住’C)A B 的比较可以比较图形下的面积也可以基于平衡点(BEP)比较 A优于B 更好的比较实用下面的方式:F1加权形式:ROC AUC参考链...

2017-03-16 00:12:00 180

转载 pandas 数据结构和数据操作

一个强大的分析结构化数据的工具集基础是NumPy,提供了高性能矩阵的运算pandas 数据结构Series类似一维数组的对象通过list构建Seriesser_obj = pd.Series(range(10))# 通过list构建Seriesser_obj = pd.Series(range(10, 20))print(type(ser_obj))获取数...

2017-03-13 14:13:00 60

转载 pandas(1):pandas 数据结构和数据操作

一个强大的分析结构化数据的工具集基础是NumPy,提供了高性能矩阵的运算pandas 数据结构Series类似一维数组的对象通过list构建Seriesser_obj = pd.Series(range(10))# 通过list构建Seriesser_obj = pd.Series(range(10, 20))print(type(ser_obj))获取数...

2017-03-13 14:08:00 191

转载 决策树算法实现(scikit-learn)

title: 决策树算法实现(scikit-learn)date: 2017-03-04 00:22:41tags: 机器学习---参考:sk-learn的决策树文档决策树的算法介绍在 Mac OS X 中安裝與使用 Graphviz 圖形視覺化工具决策树归纳算法(ID3)优先选择信息获取量最大的属性作为属性判断结点信息获取量(Information Gain):...

2017-03-04 00:31:00 288

转载 斯坦福机器学习-线性回归

title: 斯坦福机器学习-线性回归photos:http://7xrw7v.com1.z0.glb.clouddn.com/bb2cf32cadac65e934ab587c5f456329.pngtags:斯坦福机器学习date: 2016-09-05 16:34:34---摘要:单变量线性回归代价函数梯 度 下 降学习率多 变 量 线 性 回 归特...

2017-02-24 17:41:00 126

转载 字典排序

#!/usr/bin/env python# -*- coding: utf-8 -*-# Created by xuehz on 2017/2/23from collections import OrderedDictimport collectionsprint('Regular dictionary:')d = {}d['a'] = 'A'd['b'] = ...

2017-02-24 00:42:00 57

转载 保留最后N个元素

#!/usr/bin/env python# -*- coding: utf-8 -*-# Created by xuehz on 2017/2/22from collections import deque'''双端队列>>> q = deque()>>> q.append(1)>>> q.append(2)&...

2017-02-24 00:41:00 63

转载 查找最大或最小的N个元素

#!/usr/bin/env python# -*- coding: utf-8 -*-# Created by xuehz on 2017/2/24"""怎样从一个集合中获得最大或者最小的N个元素列表?"""# heapq模块有两个函数:nlargest() 和 nsmallest() 可以完美解决这个问题。import heapqnums = [1, 8, 2,...

2017-02-24 00:39:00 133

转载 Welcome to MWeb

What is MWeb? MWeb is a Pro Markdown writing, note taking and static blog generator App. MWeb used Github Flavored Markdown syntax. Please check the MWeb official website: http://www.mweb.im intr...

2017-02-21 23:59:00 138

转载 科技工作者心理健康数据分析

科技工作者心理健康数据分析http://haozhe.site数据统计各国 男性、女性心理健康数据分布#!/usr/bin/env python# -*- coding: utf-8 -*-# Created by xuehz on 2017/2/19'''目标:数据集 性别的统计'''import csvdata_path = '/Users/xuehaoz...

2017-02-21 20:23:00 408

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除