python函数辨析
code_new_life
这个作者很懒,什么都没留下…
展开
-
rand, randn, randint, seed 等
我听到的会忘记,我看到的能记住,我做过的才真正明白.rand(d0, d1, ..., dn)指定形状的随机值 大小随机均匀分布在[0,1)内 >>> np.random.rand(3,2) array([[0.95396626, 0.66629492], [0.51995889, 0.17892984], [0.42417286, 0.29742...原创 2018-02-10 16:36:38 · 2245 阅读 · 0 评论 -
pd.factorize ( ) 解析
已经遇见好几个编码的函数了 真是心累官网说明从例子中可以看到 pd.factorize() 返回的是一个tuple ,包含连个元素,第二个是源数据中所有数据的类别,当然取出了nan ,第一个是源数据在类别中对应的序号组成的array 看到这里可以发现 和pd.Categorical() 真的是非常像了。...原创 2018-10-13 11:46:23 · 8572 阅读 · 0 评论 -
pd.Categorical 的用法
最近在数据处理过程中遇到 pd.Categorical() 因此特地查了一下 先给出官网的链接 http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Categorical.html我们直接通过例子来学习In [16]: st = ['a','a','b','c','c']In [17]: ss = pd.Ca...原创 2018-08-01 21:27:11 · 25125 阅读 · 0 评论 -
LabelEncoder 和 OneHotEncoder 辨析
在特征工程工程中处理离散数据时候,需要将原来的数据转化成数字格式才能传入 模型,这时候需要用到两个编码函数1 labelEncoder LabelEncoder 可以理解为一个打标签的机器 首先 通过 fit 列表 a 来得到所有标签的种类, a 中可以有重复的数据,这个种类也就是 a 中所有不同数据的 集合,可以通过 le.classes_ 来查看,并且会给定顺序,每个数据有对...原创 2018-06-28 22:54:04 · 13220 阅读 · 0 评论 -
python 中的break 和 continue
break 和 continue 常常用在循环中。break 可以结束当前的循环,然后跳转到下一条语句(如果还有else 语句,则else 也直接跳过)。常常用在while 和 for 循环中,当某一个外部条件被触发,用以中断循环,执行之后的代码count = num/2while count > 0: if num % count ==2: print (...原创 2018-05-23 08:45:30 · 2505 阅读 · 2 评论 -
python 中的除法
python2.* 与python3.* 的除法不同,都2018年了,我们直接看python3 真正的除法 /总是返回真正的商,而且不管除数与被除数的数据类型,返回的都是浮点型>>> 9/33.0>>> 9/24.5地板除法 //意思是不管结果中有没有小数,都直接舍去,返回整数部分>>> 9//33&...原创 2018-05-23 08:16:16 · 31603 阅读 · 3 评论 -
tile() 函数
python tile() 函数简单介绍格式:tile(A,reps) * A:array_like 输入的array * reps:array_like A沿各个维度重复的次数for example:A=[1,2]tile(A,2)Out[10]: array([1, 2, 1, 2])tile(A,(2,2))Out[11]...原创 2018-05-04 18:10:00 · 6140 阅读 · 0 评论 -
python range( ) 和 arange( )
这两个函数都是python 中的常用函数,经常遇到,有时候还是会懵逼一会,这里特地记录一下首先 range( n ) 代表数字0 到(n-1) 在python 2 返回的是一个list , 但是python 3 返回的是一个range 对象,In [27]: a = range(10)In [28]: aOut[28]: range(0, 10)In [2...原创 2018-04-21 16:32:06 · 1283 阅读 · 0 评论 -
python 中 str.split( ) 函数
先看文档中是怎么说的 S.split(sep=None, maxsplit=-1) -> list of strings Return a list of the words in S, using sep as the delimiter string. If maxsplit is given, at most maxsplit splits are...原创 2018-04-20 21:35:04 · 9727 阅读 · 0 评论 -
python 计数方法小结
在项目中经常会遇见需要计数的情况,最近在看《利用python进行数据分析》这里面提到了三个计数方法:方法一: 遍历法def get_counts(sequence): counts = {} for x in sequence: if x in counts: counts[x] += 1 else: ...原创 2018-04-20 21:14:36 · 7904 阅读 · 0 评论 -
python 中 setattr() 函数 和 getarrr() 函数
setattr() 用来创建属性,经常用在创建类时候,在 init 方法中如果为了以后再加上某些属性,可以留一个关键字参数 setattr() 接受三个参数 setattr(对象,属性名,属性值)class Person(object): def __init__(self,name,gender,birth,**kw): self.name = name...原创 2018-04-14 10:49:19 · 1526 阅读 · 0 评论 -
list.sort 方法 和内置函数sorted
list.sort() 方法会就地排序列表,也就是说是针对原来的数据进行改变,而不是新建一个列表,然后返回None ,>>> a = ['action','is','better','than','nothing']>>> a.sort()>>> a['action', 'better', 'is', 'nothing', 'th...原创 2018-04-14 10:04:05 · 458 阅读 · 0 评论 -
join ( ) 函数
我听到的会忘记,我看到的能记住,我做过的才真正明白.join()函数 用特定的字符或者符号来分隔一串元素语法: ' A ' . join ( B )参数说明A:分隔符。可以为空或者空格甚至是数字B:要连接的元素序列、字符串、元组、字典上面的语法即:以 A 作为分隔符,将 B 所有的元素合并成一个新的字符串返回值:返回一个以分隔符 A 连接各个元素后生成的字符串>>> ...原创 2018-03-27 21:01:08 · 9107 阅读 · 0 评论 -
pandas.cut qcut 面元划分
我听到的会忘记,我看到的能记住,我做过的才真正明白.cut 用法: pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False) 返回 x 中的每一个数据 在bins 中对应 的范围 其中: X : 必须是一维数据 bins: ...原创 2018-03-27 17:54:46 · 3311 阅读 · 0 评论 -
pandas 时间序列 之日期范围、频率及移动
生成日期范围 用到函数为 pandas.date_range :使用时有三种方法:第一种传入 开始和结束时间:index = pd.date_range('4/1/2012', '6/1/2012') #默认按天计算indexDatetimeIndex(['2012-05-13', '2012-05-14', '2012-05-15', '2012-05-16', ...原创 2018-04-01 21:58:07 · 7248 阅读 · 0 评论 -
pandas 时间序列基础
pandas 中最常用的时间序列类型就是以时间戳为索引的Series :from datetime import datetimedates = [datetime(2011, 1, 2), datetime(2011, 1, 5), datetime(2011, 1, 7), datetime(2011, 1, 8), datetime(2011, 1, 10), date...原创 2018-04-01 11:11:46 · 329 阅读 · 0 评论 -
pands 时间序列 之日期和时间数据类型及工具
Python 标准库包含用于日期(date)和时间(time)数据的数据类型,而且还有日历方面的功能,我们主要会用到datetime、time以及calendar模块。datetime.datetime 是用的最多的数据类型:In [1]: from datetime import datetimeIn [2]: now = datetime.now()In [3]: nowOut[3...原创 2018-04-01 10:22:54 · 350 阅读 · 0 评论 -
flatten( ) 和 ravel( ) 区分
在做项目时候遇见的flatten ( ) 函数 查询时候发现还有一个和它比较像的函数 在这里记录一下np.flatten( ) 官方文档ravel( ) 和 flatten( )都有展开的意思,默认按照行展开 传入 F 则按照列展开区别在于flatten 展开后是原来数据的copy 但是ravel 是原来数据的视图可以看到ravel() 赋值后原来数据变了 ,这就是两者不...原创 2018-10-08 22:49:21 · 2500 阅读 · 1 评论