代码积累
进击的程序员XA51
从今天开始,为成为一个合格的软件工程师而奋斗
展开
-
python 使用笔记
zip的使用:a = [1,2,3]c = ['a','b','c']n = a.zip(c) #n = [(1,'a').....]zip(*a):#a= ["Hello hello", "Hello New York", "York says hello"],zip(*a)为每个元素的字母依次组成元组的list [('H', 'H', 'Y'), ('e', 'e', 'o')....原创 2018-12-12 10:26:59 · 343 阅读 · 0 评论 -
K_means 算法
算法原理kmeans的计算方法如下:1 随机选取k个中心点2 遍历所有数据,将每个数据划分到最近的中心点中3 计算每个聚类的平均值,并作为新的中心点4 重复2-3,直到这k个中线点不再变化(收敛了),或执行了足够多的迭代时间复杂度:O(I*n*k*m)空间复杂度:O(n*m)其中m为每个元素字段个数,n为数据量,I为跌打个数。一般I,k,m均可认为是常量,所以时间和...原创 2019-04-11 11:35:18 · 448 阅读 · 0 评论 -
hadoop 语法积累
查看部分文件内容:hadoop fs -text 文件 | head -5原创 2019-05-21 19:49:39 · 274 阅读 · 0 评论 -
spark Sql
读取和存数据:hivre 中读取直接就可以写SQL,逻辑类似在hive 中一样,但从其他数据源中读取数据时,需要先用registerTempTable命表名,再进行查询。这些数据也可以使用rdd操作函数#从hive中读取:from pyspark import HiveContextfrom pyspark import SparkContextfrom pyspark imp...原创 2019-07-10 21:45:43 · 131 阅读 · 0 评论 -
牛客网编程输入输出问题
单行输入:import sysfor line in sys.stdin: offset,n,l1,l2 = list(map(int,line.strip().split())) #输出 print start1,end1,start2,end2多行输入:import sysimport syswhile True: line1= sys....原创 2019-08-11 14:48:13 · 1080 阅读 · 0 评论 -
SQL总结
SQL的执行顺序:(1)from(3) join(2) on(4) where(5)group by(开始使用select中的别名,后面的语句中都可以使用)(6) avg,sum....(7)having(8) select(9) distinct(10) order by...原创 2019-08-21 09:31:10 · 129 阅读 · 0 评论 -
软件开发面试代码题
排序算法:def bubble_sort(seq): # 冒泡排序 count = len(seq) for i in range(0, count): for j in range(i + 1, count): if seq[i] > seq[j]: seq[i], seq[j] = l...原创 2019-09-23 20:30:54 · 238 阅读 · 0 评论