自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(128)
  • 收藏
  • 关注

原创 2080. 区间内查询数字的频率

哈希表+二分查找class RangeFreqQuery: def __init__(self, arr: List[int]): self.cnts = defaultdict(list) for i,num in enumerate(arr): self.cnts[num].append(i) def query(self, left: int, right: int, value: int) -> int:

2021-11-23 20:00:17 336

原创 1992. 找到所有的农场组

从两边延伸,退耕还林def find_farmland(land): m, n, res = len(land), len(land[0]), [] for i in range(m): for j in range(n): if land[i][j] == 1: r, c = i, j while r < m - 1 and land[r + 1][j] == 1:

2021-11-19 17:44:45 394

原创 最小未被占据椅子的编号

最小未被占据椅子的编号解法:最小堆+哈希表我们需要一个数据结构来维护未被占据的椅子,且该数据结构需要在较低的时间复杂度内实现查询并弹出最小值与插入元素操作,我们可以用一个最小堆实现的优先队列来维护。# coding=utf-8from collections import defaultdictfrom heapq import heappush, heappop# 其他: heapify(heap) 让列表具备堆特征。def min_desk(times, targetFriend):

2021-11-18 17:19:21 272

原创 spark数据倾斜及解决数据倾斜的8种方法

添加链接描述

2021-10-21 18:14:41 424

原创 ROC曲线怎么绘制

[https://blog.csdn.net/xiaohuihui1994/article/details/87987836]

2021-07-23 11:27:13 232

原创 golang学习

golang通道实现生产者、消费者package awesomeProject1import ( "fmt" "math/rand" "time")// 数据生产者func producer(header string, channel chan<-string) { for { channel <- fmt.Sprintf("%s: %v", header, rand.Int31()) time.Sleep(1*time.Second) }}// 数据消费

2021-06-28 15:27:37 127

原创 spark中使用udf函数

https://zhuanlan.zhihu.com/p/64410979

2021-06-10 17:41:08 371

原创 极大似然估计与最大后验概率估计

https://zhuanlan.zhihu.com/p/40024110

2021-05-11 17:31:32 79

原创 python降低cpu的占用

import signalimport resourceimport osimport timefrom multiprocessing import Processdef time_exceeded(signo, frame): time.sleep(0.1) # raise SystemExit(1)def set_max_runtime(seconds): soft,hard = resource.getrlimit(resource.RLIMIT_CPU)

2021-03-10 17:43:01 1507

原创 tensorflow训练的异步、并发和并行

[https://www.cnblogs.com/zyly/p/8982335.html]

2021-02-25 16:27:50 404

原创 cpu内存、磁盘访问速度、网络速度

google 工程师Jeff Dean 首先在他关于分布式系统的ppt文档列出来的,到处被引用的很多。1纳秒等于10亿分之一秒,= 10 ^ -9 秒

2021-02-24 20:12:16 608

原创 go语言中 %d %s等格式化指令

格式化指令 含义%b 一个二进制整数,将一个整数格式转化为二进制的表达方式%c 一个Unicode的字符%d 十进制整数%o 八进制整数%x 小写的十六进制数值%X 大写的十六进制数值%U 一个Unicode表示法表示的整型码值%s 输出以原生的UTF8字节表示的字符,如果console不支持utf8编码,则会乱码%t 以true或者false的方式输出布尔值%v 使用默认格式输出值,或者如果方法存在,则使用类性值的String()方法输出自定义值%T 输出值的类型...

2021-02-03 15:14:23 2956

原创 python2.7正确安装cv2

需要加上清华源,另外指定版本到3.2左右,新版本的import时会报错。python2 -m pip install opencv-python==3.2.0.6 -i https://pypi.tuna.tsinghua.edu.cn/simple

2021-01-05 14:42:18 1285

原创 go语言 -- 并发

[https://www.cnblogs.com/yinzhengjie/p/7771645.html]

2020-12-04 20:09:38 89

原创 linux命令和shell命令

linux cat命令1、cat(英文全拼:concatenate)命令用于连接文件并打印到标准输出设备上。把 textfile1 的文档内容加上行号后输入 textfile2 这个文档里:cat -n textfile1 > textfile2把 textfile1 和 textfile2 的文档内容加上行号(空白行不加)之后将内容附加到 textfile3 文档里:cat -b textfile1 textfile2 >> textfile3清空 /etc/test.tx

2020-11-20 19:21:08 122

原创 shell命令

if [$? !=0]的用法:if [ $? != 0 ]; then echo "process faild" exit 1fi注释:$?是上一个程序执行是否成功的标志,如果执行成功则$? 为0,否则 不为0

2020-11-16 10:20:22 80

原创 pyspark重复数据中取时间最新的(最简洁明了)

>>> col_names = ["name", "date", "score"]>>> value = [... ("Ali", "20200101", 10.0),... ("Ali", "20200102", 10.0),... ("Ali", "20200103", 10.0),... ("Ali", "20200104", 10.0),... ("Ali", "20200101", 9.0),...

2020-11-09 20:34:48 412

原创 grpc详细入门(golang)

所谓RPC(remote procedure call 远程过程调用)框架实际是提供了一套机制,使得应用程序之间可以进行通信,而且也遵从server/client模型。使用的时候客户端调用server端提供的接口就像是调用本地的函数一样。gRPC的优势,如下:1.gRPC可以通过protobuf来定义接口,从而可以有更加严格的接口约束条件。2.通过protobuf可以将数据序列化为二进制编码,这会大幅减少需要传输的数据量,从而大幅提高性能。3.gRPC可以方便地支持流式通信。流程:1.创建接口文

2020-10-29 15:57:08 1577

原创 tensorflow模型不收敛的原因

模型不收敛的原因1.数据量少的话,一般不会带来不收敛不收敛一般是由于样本的信息量太大导致网络不足以fit住整个样本空间,样本少只可能带来过拟合的问题。降低过拟合的方法:比如dropout,SGD,增大minibatch的数量,减少fc层的节点数量,momentum,finetune等。2.尽量收集更多的数据3.尽可能用小模型数据量太少应考虑缩小模型复杂度。考虑减少层数或者减少kerne...

2020-01-03 10:55:21 1860 1

原创 tensorflow tensor或numpy数组打印出全部值

tensorflow tensor或numpy数组打印出全部值1、加入以下代码import numpy as np np.set_printoptions(threshold=np.inf)

2019-11-12 18:54:02 1378

转载 pip install Yellowfin失败的问题

https://blog.csdn.net/quqiaoluo5620/article/details/80608474在Pycharm中安装Yellowfin时一直报错"no such file or directory: '/temp/pip-build-jykvuD/YellowFin/README.md “,但是项目中需要"from yellowfin import YFOptimize...

2019-11-11 11:50:30 235

原创 tf.data.TFRecordDataset的使用

pass

2019-11-11 11:21:18 581

原创 机器学习----拉马努金式思维训练法

https://zhuanlan.zhihu.com/p/51934140

2019-11-07 11:55:44 450

原创 Linux中软链接和硬链接

1.链接的概念简单的理解链接就是快捷方式,在Windows系统中,快捷方式就是指向原文件的一个链接文件,可以让用户从不同的位置来访问原始的文件;原文件一旦被删除或剪切到其他地方后,会导致链接文件失效。但是在Linux系统中这个看似简单的东西和Windows里的可能不大一样。2.链接的分类在Linux系统中有软、硬两种链接文件之分。硬链接(hard link)我们可以将它理解为一个“指向原...

2019-11-06 13:55:32 154

原创 tensorboard可视化--绘制loss变化图及网络图

import tensorflow as tf##定义一个简单的计算图,实现两个常量相加的操作with tf.name_scope('graph') as scope: a = tf.constant(1, name='a') b = tf.constant(2, name='b') add = tf.add(a, b, name='add')sess = tf.S...

2019-11-05 20:16:28 2860 1

原创 python&c++ zigzag conversion

Z字形变换Input: s = “PAYPALISHIRING”, numRows = 4Output: “PINALSIGYAHRPI”Explanation:P I NA L S I GY A H RP I

2019-11-04 21:55:09 83

原创 bagging和boosting

面对一个机器学习问题,通常有两种策略,一种是尝试各种模型选择其中表现最好的模型做重点调参优化。另外一种策略是集各家之长,核心是将多个分类器的结果统一成一个最终的决策,使用这类策略的机器学习方法称为集成学习,其中的每个单独的分类器成为基分类器。Boostingboosting方法训练基分类器时采用串行的方式,各个基分类器之间有依赖。它的基本思路是将基分类器层层叠加,每一层在训练的时候,对前一层...

2019-09-10 13:40:12 561

原创 Kmeans算法与KNN算法的区别

kmeans算法的缺陷:1.聚类中心的数量k需要事先给定,但在实际中这个k值的选定是非常难以进行估计的,很多时候,事先并不知道给定的数据集应该分成多少个类别才更合适。2.kmeans需要初始化聚类中心,不同的初始聚类中心可能导致完全不同的聚类效果。针对第2个缺陷,可以使用kmeans++算法来解决。knnknn本质上是基于一种数据统计的方法!其实很多机器学习算法也是基于数据统计的。k...

2019-09-05 15:03:10 560

原创 面试题目汇总

1.千亿级数据量下,找两句话相似度,如何降低复杂度?通过SimHash算法来实现海量文本的相似度计算与快速去重,通过海明距离,计算相似度,然后再通过抽屉原理提升效率。SimHash 是 Google 在2007年发表的论文《Detecting Near-Duplicates for Web Crawling 》中提到的一种指纹生成算法或者叫指纹提取算法,被 Google 广泛应用在亿级的网页去...

2019-08-27 16:27:16 136

转载 转载---cnn反向传播的推导

原文地址:https://blog.csdn.net/legend_hua/article/details/81590979 上一篇文章介绍了DNN的反向传播,对DNN不清楚的可以去看看,CNN在DNN的基础上进行解释。一、回顾DNN的反向传播上一篇DNN反向传播过程得出结论:1、计算每一层的W、b的梯...

2019-08-27 10:33:27 161

转载 L1、L2正则的具体实现

地址:https://blog.csdn.net/red_stone1/article/details/80755144

2019-07-29 11:28:14 319

转载 正向与反向传播推导

https://blog.csdn.net/u013894072/article/details/83586044

2019-07-25 18:05:27 252

原创 tensorflow模型剪枝,通过model_pruning

https://blog.csdn.net/lai_cheng/article/details/90643100#commentBox模型训练时剪枝,只需选定需要剪枝的层,对于选中做剪枝的层增加一个二进制掩模(mask)变量,形状和该层的权值张量形状完全相同。该掩模决定了哪些权值参与前向计算。掩模更新算法则需要为 TensorFlow 训练计算图注入特殊运算符,对当前层权值按绝对值大小排序,对幅...

2019-07-24 17:53:40 2218

原创 剑指offer题目整理

1.数组中重复数字给定长度为n数组,数组中所有数字都在0-n-1范围内哈希表时间复杂度太高用元素值作为位置索引的值,与该元素所在位置的值判断相不相等。list[I]==list[list[I]]? list[i]:swap(list[i],list[list[i]])def findCommon(arr): for i in range(len(arr)): wh...

2019-07-22 00:07:37 370

原创 实现pow(a,n)----a的n次方

def power(a,n): if n==0: return 1 res,temp=1,a while n: if n&1: res*=temp n>>=1 print("n:",n) temp*=temp return resprint(...

2019-07-08 20:13:38 887

原创 graph attention network原理及代码解析

代码实现:通过一维卷积增加非线性,赋予不同权重,然后通过矩阵加矩阵的转置,来对attention的权重进行学习,通过-1e9(1-邻接矩阵),以及softmax来过滤掉不与当前顶点相连的节点。通过叠加GAT网络,来对高阶节点信息进行加权。。。import numpy as npimport tensorflow as tffrom utils import layersfrom ...

2019-07-02 18:09:00 4612

转载 python内存不释放

转载地址:https://blog.csdn.net/shaququ/article/details/52100434在maillist里面看到无数次的有人问,python速度为什么这么慢,python内存管理很差。实话说,我前面已经说过了。如果你在意内存/CPU,不要用python,改用C吧。就算C不行,起码也用个go或者java。不过今天还是说说,python的内存为什么不释放。首先,py...

2019-06-28 17:52:23 1491

原创 python验证二叉搜索树

如果左子树的值小于根的值并且右子树的值大于根的值,并进行递归,成立则为二叉搜索树,否则则不是。class TreeNode: def __init__(self,x): self.val=x self.left=None self.right=Nonedef isValidBST(self,root): min=max=None...

2019-06-27 20:10:22 851

原创 spark中RDD的相关操作

# # parallelize:并行化数据,转化为RDD# data = [1, 2, 3, 4, 5]# distData = sc.parallelize(data, numSlices=10) # numSlices为分块数目,根据集群数进行分块 # # textFile读取外部数据# rdd = sc.textFile("./c2.txt") # 以行为单位读取外部文件,并转...

2019-06-20 14:28:05 201

原创 python判断链表有环、翻转链表、链表交换相邻元素

#defination of listNodeclass ListNode: def __init__(self,x): self.val=x self.next=Noneclass Solution: def reverselist(self,head): cur,prev=head,None while cu...

2019-06-19 20:11:43 305

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除