python
smile__su
这个作者很懒,什么都没留下…
展开
-
kafka.errors.KafkaTimeoutError: KafkaTimeoutError: Failed to update metadata after 60.0 secs.
连接超时修改kafka的 config/server.properties文件中:advertised.listeners=PLAINTEXT://IP地址:9092重启kafka服务原创 2019-04-05 15:32:37 · 14312 阅读 · 5 评论 -
python调用kafka
先启动hadoop,zookeeper,kafka启动命令hadoop启动命令 sbin/start-all.shzookeeper启动命令 ./bin/zkServer.sh start 每台机器都要启动kafka启动命令 bin/kafka-server-start.sh config/server.properties 每台机器都要启动进行以下操作的前提是将had...原创 2019-04-04 15:14:07 · 956 阅读 · 0 评论 -
python将字符串转换为byte
str_object.encode('utf-8')python3可用原创 2019-04-04 14:26:35 · 7175 阅读 · 0 评论 -
判断nan的方法
转载:https://blog.csdn.net/jpbirdy/article/details/52333301python在数据预处理的时候,经常遇到需要对空值进行处理的地方。空值在python中的表现一般为:1、None2、False3、''4、nan前3个很容易判断,直接=就可以了,第四种比较蛋疼,因为你会发现,它无法用==进行判断(这个跟nan的原因有关),这...转载 2018-08-07 23:29:19 · 1365 阅读 · 0 评论 -
Python集合set类型的操作
python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算. sets 支持 x in set, len(set),和 for x in set。作为一个无序的集合,sets不记录元素位置或...转载 2018-07-23 20:39:38 · 136 阅读 · 0 评论 -
pandas.Series.resample
转载:http://www.cnblogs.com/hhh5460/p/5596340.htmlresample与groupby的区别:resample:在给定的时间单位内重取样groupby:对给定的数据条目进行统计函数原型:DataFrame.resample(rule, how=None, axis=0, fill_method=None, closed=None, label=None, ...转载 2018-05-27 12:59:53 · 519 阅读 · 0 评论 -
Pandas将列表(List)转换为数据框(Dataframe)
转载:https://blog.csdn.net/claroja/article/details/64439735Python中将列表转换成为数据框有两种情况:第一种是两个不同列表转换成一个数据框,第二种是一个包含不同子列表的列表转换成为数据框。第一种:两个不同列表转换成为数据框from pandas.core.frame import DataFramea=[1,2,3,4] #列表ab...转载 2018-04-05 20:39:02 · 50396 阅读 · 2 评论 -
operator.itemgetter函数和字典的item()函数
operator模块提供的itemgetter函数用于获取对象的哪些维的数据,参数为一些序号。看下面的例子a = [1,2,3] >>> b=operator.itemgetter(1) //定义函数b,获取对象的第1个域的值>>> b(a) 2>>> b=operator.itemgetter(1,0) //定义函数b,获取对象的...原创 2018-04-03 22:11:26 · 460 阅读 · 0 评论 -
numpy基本方法总结(持续更新中)
转载:https://www.cnblogs.com/xinchrome/p/5043480.html一、数组方法创建数组:arange()创建一维数组;array()创建一维或者多维数组,其参数是类似于数组的对象,如列表等。反过来转换(数组转化为列表)则可以使用numpy.ndarray.tolist()函数,如a.tolist()创建数组:np.zeros((2,3)) (数组中元素全为0)...转载 2018-04-10 12:51:06 · 526 阅读 · 0 评论 -
python常用内置函数
1.divmod(a,b)返回一个包含商和余数的元组(a/b,a%b)2.enumerate()函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据下标和数据,一般用在for循环中。语法:enumerate(seq,start)参数: seq:一个序列、迭代器或者其它支持迭代对象(如列表、元组或字符串)。 start:下标起始位置3.all()与...原创 2018-04-16 17:20:11 · 487 阅读 · 0 评论 -
python set add 导致问题 TypeError: unhashable type: 'list'
转载:https://www.cnblogs.com/kaituorensheng/p/5694555.html>>> a = set()>>> b = set()>>> b.add(1)>>> a.add(b)Traceback (most recent call last): File "<stdin转载 2018-04-02 18:09:34 · 836 阅读 · 0 评论 -
list列表、tuple元组、dict字典总结
一、list列表1.删除列表元素del list1[2] 删除list1的第三个元素 (注意第一个元素的下标为0)2.list操作符a=[1,2,3] b=[4,5,6]python表达式结果描述len(a)3长度a+b[1,2,3,4,5,6,]组合['Hi!']*4['Hi!','Hi!','Hi!','Hi!']重复3 in aTrue元素是否存在于列表中for i in a: ...原创 2018-04-15 17:43:45 · 345 阅读 · 0 评论 -
python面向对象编程基础
一、概念类(Class): 用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。类变量:类变量在整个实例化的对象中是公用的。类变量定义在类中且在函数体之外。类变量通常不作为实例变量使用。数据成员:类变量或者实例变量用于处理类及其实例对象的相关的数据。方法重写:如果从父类继承的方法不能满足子类的需求,可以对其进行改写,这个过程叫方法的覆盖(overr...原创 2018-03-26 08:47:56 · 198 阅读 · 0 评论 -
numpy广播机制
1.广播法则是为了更好的处理不同维数矩阵之间的运算1)广播第一法则是,如果所有的输入数组维度不都相同,一个“1”将被重复地添加在维度较小的数组上直至所有的数组拥有一样的维度。2)广播第二法则确定长度为1的数组沿着特殊的方向表现地好像它有沿着那个方向最大形状的大小。对数组来说,沿着那个维度的数组元素的值理应相同。实例:a=arange(8).reshape(2,4)a=array([[0, 1,...原创 2018-03-17 11:02:53 · 464 阅读 · 0 评论 -
df.loc用法
df.loc[行标签,列标签]df.loc['a':'b']#选取ab两行数据df.loc[:,'one']#选取one列的数据示例代码df.loc[ (df.Cabin.notnull()), 'Cabin' ] = "Yes"上一行代码的意思是:选取Cabin列中不为空的位置替换为“Yes”...原创 2019-04-02 11:31:15 · 23955 阅读 · 2 评论