- 博客(12)
- 收藏
- 关注
原创 各种统计量指标
各种统计量指标(1)Weight ofEvidence(WoE)注:是指每个变量取值的权重,分bin,相当于单维看连续变量取值分区间,类型变量取离散的值。(2)InformationValue (IV)含义:预测变量特征信息的数量,从坏的中分离出好的。变量不同取值信息加和。 (3)PopulationStability Index(PSI)人口稳定性指标形式
2016-05-06 16:25:31 6061
原创 Python学习2016.4.14
(1)列表和序列有自己的排序sort方法,其对列表进行原址排序,所以元组没有(因为不可修改)sorted函数可以获得排序后的副本,不用引包可以直接用,不过序列排序后返回的是列表,序列自己的sort方法由于是原址排序,所以还是序列,不会改变类型。s =pd.Series([1, 6, 4, 0])s_sort= sorted(s)print(s_sort)print(type(s
2016-05-06 16:23:15 231
原创 python学习2016.4.13
Python函数 (1)数据框的另一种定义方式,将数据内容(多维数组)直接放入data中,再定义columns和index。(数据框.columns是取列名,.index是取行名,取出的类型类似元组,可以用[0],[1]…直接取出)df = pd.DataFrame(data=[[34, 'null', 'mark'], [22, 'null','mark'], [34, 'null'
2016-05-06 16:18:12 598
原创 Python学习2016.4.12
Python函数(1)isinstance,来判断一个对象是否是一个已知的类型。isinstance说明如下:isinstance(object, class-or-type-or-tuple)-> bool isinstance(x, (A, B, ...)) 其第一个参数为对象,第二个为类型名或类型名的一个列表。其返回值为布尔型。若对象的类型与参数二的类型相同则返
2016-05-06 16:11:37 440
原创 python学习2016.4.1
(1)pandas.Series.value_counts:返回对象中包含唯一值个数,Series.value_counts(normalize=False, sort=True, ascending=False, bins=None,dropna=True)参数:normalize : boolean, default False如果True则返回coun
2016-05-06 16:00:22 1864
原创 python学习2016.3.31
2016.3.31(1)用type()可以查看任意数据类型。如果是单个数值,则显示具体数值类型;如果是存储容器,则显示对应的存储类型。示例:输出结果:注:若果不用np.mat([])定义矩阵或数组,用[ ]定义的存储类型都是List,无论是[]还是[[ ]]。数据框对应pandas包,df =pd.DataFrame()由于有多个列,查看各列
2016-05-05 11:53:01 639
原创 Python学习2016.3.30
2016.3.30 类型描述例子备注str一个由字符组成的不可更改的有串行。'Wikipedia'"Wikipedia""""Spanningmultiplelines"""在Python 3.x里,字符串由Unicode字符组成
2016-05-05 11:44:17 581
原创 SQL学习
2016.3.29SQL Server不区分大小写(1)isnull :使用指定的替换替换NULL。用法:ISNULL ( check_expression ,replacement_value )check_expression:将被检查是否为 NULL的表达式,可以是任何类型的。replacement_value:在 check_expression 为 NULL时将返
2016-05-05 11:42:50 294
原创 SQL转换时间函数用法
2016.4.28(1) getdate():获取当前时间。Dateadd(datepart , number, date ): 在向指定日期加上一段时间的基础上,返回新的 datetime 值。select DateAdd(MM,2,'2008-8-8') --------------返回:2008-10-08 00:00:00.000select DateAdd(dd,2,'2
2016-05-05 11:19:40 682
转载 Python制作统计图形
Python制作统计图形作者: admin 分类: python, 数据分析 发布时间: 2014-07-19 17:37 ė 6没有评论Python一般使用Matplotlib制作统计图形,用它自己的说法是‘让简单的事情简单,让复杂的事情变得可能’。(你说国外的“码农”咋这么会说,我就整不出来这工整的句子!)用它可以制作折线图,直方图,条形图,散点图,饼图,谱图等等你能想
2016-05-03 18:10:17 9539
转载 python数字图像处理:直方图与均衡化
在图像处理中,直方图是非常重要,也是非常有用的一个处理要素。在skimage库中对直方图的处理,是放在exposure这个模块中。1、计算直方图函数:skimage.exposure.histogram(image, nbins=256)在numpy包中,也提供了一个计算直方图的函数histogram(),两者大同小义。返回一个tuple(hist, bin
2016-05-03 17:56:56 1025
转载 Pyhotn 中编码的问题:'ascii' codec can't decode byte 0xef in position 0: ordinal not in range(128)的错误
在Django视图函数中经常出现类似于'ascii' codec can't decode byte 0xef in position 0:ordinal not in range(128)的错误。 在解决错误之前,首先要了解unicode和utf-8的区别。 unicode指的是万国码,是一种“字码表”。而utf-8是这种字码表储存的编码方法。unicode不
2016-05-03 11:51:13 118908 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人