瑾明达2号
码龄7年
关注
提问 私信
  • 博客:127,096
    问答:19
    动态:4
    127,119
    总访问量
  • 112
    原创
  • 924,695
    排名
  • 20
    粉丝
  • 0
    铁粉

个人简介:Happy cooperation

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:天津市
  • 加入CSDN时间: 2018-08-28
博客简介:

weixin_43087913的博客

查看详细资料
个人成就
  • 获得41次点赞
  • 内容获得24次评论
  • 获得191次收藏
  • 代码片获得423次分享
创作历程
  • 77篇
    2021年
  • 109篇
    2020年
  • 2篇
    2019年
成就勋章
TA的专栏
  • 机器学习
    15篇
  • scala
    2篇
  • tensorflow1
    9篇
  • leetcode
    8篇
  • pyhon
    16篇
  • 算法题
    8篇
  • shell
    2篇
  • spark
    9篇
  • Linux操作系统
    13篇
  • del
    1篇
  • home
    1篇
  • end
    1篇
  • hadoop
    1篇
  • obs
    1篇
  • 百面机器学习
    12篇
  • Unix操作系统
    5篇
  • Leetcode数组
    14篇
  • go
    1篇
  • beego
    8篇
  • 软件工具
    3篇
  • 软件安装教程
    5篇
兴趣领域 设置
  • 大数据
    spark
  • 人工智能
    机器学习深度学习神经网络tensorflow
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

flink1.13.6如何集成parquet avro

发布问题 2023.06.26 ·
1 回答

推荐系统常用名词

1. 播放类指标VV(Video View,播放数),是指在一个统计周期内,视频被打开的次数之和。 CV(Content Views,内容播放数),是指在一个统计周期内,视频被打开,且视频正片内容(除广告)被成功播放的次数之和。由于用户在广告播放的时候流失,所以CV<VV。2. 浏览类指标PV(Page View,浏览量),是指在一个统计周期内,浏览页面的数之和。 UV(Unique Visitor,访客数),是指在一个统计周期内,访问网站的人数之和。其中,PV的统计方式很容易理解,通常
转载
发布博客 2021.08.09 ·
559 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

shell中循环日期的程序

#!/bin/bashbegin_date="20210701"end_date="20210715"while [ "$begin_date" -le "$end_date" ];do echo ${begin_date} begin_date=$(date -d "${begin_date}+1days" +%Y%m%d)done在服务器中是可以的,在macos中不可以
原创
发布博客 2021.07.19 ·
367 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

批量将python文件的缩进由2空格转4空格?

安装autopep8pip install autopep8mac下:brewinstall autopep8autopep8 --in-place --aggressive --aggressive <filename>
原创
发布博客 2021.07.09 ·
522 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

tensorflow中tf.Graph()使用说明

转自:http://blog.sina.com.cn/s/blog_628cc2b70102yonj.htmltf.Graph()表示实例化一个用于tensorflow计算和表示用的数据流图,不负责运行计算。在代码中添加的操作和数据都是画在纸上的画,而图就是呈现这些画的纸。我们可以利用很多线程生成很多张图,但是默认图就只有一张。tf中可以定义多个计算图,不同计算图上的张量和运算是相互独立的,不会共享。计算图可以用来隔离张量和计算,同时提供了管理张量和计算的机制。1、使用g = t...
转载
发布博客 2021.07.09 ·
1154 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Spark dataframe某一列转化为Array

首先,必须保证列没有空值,如果有,则需要dropcolName 为 列名data = data.na.drop(s"$colName")输出格式为Array[Any] ()data0.select(s"$colname").collect().map(_(0))输出为Array[String]data0.select(s"$colname").collect().map(_(0).toString)输出为Array[Double]data0.select(s"$coln
原创
发布博客 2021.07.09 ·
2343 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

tf.squeeze()函数

tf.squeeze()函数用于从张量形状中移除大小为1的维度squeeze( input, axis=None, name=None, squeeze_dims=None)给定张量输入,此操作返回相同类型的张量,并删除所有维度为1的维度。 如果不想删除所有维度1维度,可以通过指定squeeze_dims来删除特定维度1维度。如果不想删除所有大小是1的维度,可以通过squeeze_dims指定。参数: input:A Tensor。输入要挤...
转载
发布博客 2021.07.09 ·
777 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Word Hashing

英文的输入层通过Word Hashing方式处理,该方法基于字母的n-gram,主要作用是减少输入向量的维度。举例说明,假如现在有个词boy,开始和结束字符分别用#表示,那么输入就是(#boy#)。将词转化为字母n-gram的形式,如果设置n为3,那么就能得到(#bo,boy,oy#)三组数据,将这三组数据用n-gram的向量来表示。使用Word Hashing方法存在的问题是可能造成冲突。因为两个不同的词可能有相同的n-gram向量表示。下图是在不同的英语词典中分别使用2-gram和3-gram进行W
转载
发布博客 2021.07.08 ·
1397 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Spark 创建Dataframe和创建空的DataFrame

创建空的DataFramevar ret = spark.emptyDataFrame1. 隐式转换toDF1)使用case-class引入隐式转换的包import sqlContext.implicits._创建case-class的Rdd val rdd: RDD[Person] = sc.parallelize(Array( Person("fanghailiang", 29), Person("sunyu", 28), .
转载
发布博客 2021.07.08 ·
1047 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

召回及粗排模型的负例选择问题

转自:https://blog.csdn.net/weixin_31866177/article/details/117781645我们训练精排模型的时候(假设是优化点击目标),一般会用“用户点击”实例作为正例,“曝光未点击”实例作为负例,来训练模型,基本大家都是这么干的。现在,模型召回以及粗排,也需要训练模型,意思是说,也需要定义正例和负例。一般正例,也都是用“用户点击”实例作为正例,但是怎么选择负例,这里面有不少学问。Sample Selection Bias问题我们先来看下不同阶段模型面对
转载
发布博客 2021.07.06 ·
385 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

python中的*args和**kw

转自:https://blog.csdn.net/callinglove/article/details/45483097,这里有更详尽的使用和理解,遇到问题可以再查看在python中定义函数,可以使用一般参数、默认参数、非关键字参数和关键字参数。一般参数和默认参数在前面的学习中我们都遇到过了,而*args和**kw分别属于非关键字参数和关键字参数,后两者也都是可变参数。非关键字参数的特征是一个星号*加上参数名,比如*number,定义后,number可以接收任意数量的参数,并将它们储存
转载
发布博客 2021.07.06 ·
322 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python中的偏函数partial

转自:https://www.cnblogs.com/zhaopanpan/p/9397485.htmlPython的functools模块提供了很多有用的功能,其中一个就是偏函数(Partial function)。在介绍函数参数的时候,我们讲到,通过设定参数的默认值,可以降低函数调用的难度。而偏函数也可以做到这一点。举例如下:int()函数可以把字符串转换为整数,当仅传入字符串时,int()函数默认按十进制转换:int('12345')int('12345', base=8)int
转载
发布博客 2021.07.06 ·
204 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

tf.zeros_like函数

转自:https://www.cnblogs.com/tsdblogs/p/10404756.htmltf.zeros_like( tensor, dtype=None, name=None, optimize=True)创建一个所有元素都设置为零的张量.给定一个张量(tensor),该操作返回与所有元素设置为零的tensor具有相同类型和形状的张量.或者,您可以使用dtype指定返回张量的新类型.例如:tensor = tf.constant(..
转载
发布博客 2021.07.06 ·
1814 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

tensorflow中用来拼接张量的函数tf.concat(),用法:

转自:https://blog.csdn.net/leviopku/article/details/82380118tf.concat([tensor1, tensor2, tensor3,...], axis)先给出tf源代码中的解释: t1 = [[1, 2, 3], [4, 5, 6]] t2 = [[7, 8, 9], [10, 11, 12]] tf.concat([t1, t2], 0) # [[1, 2, 3], [4, 5, 6], [7, 8, 9], [10.
转载
发布博客 2021.07.06 ·
762 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

tf.gather(params,indices,axis=0 )从params的axis维根据indices的参数值获取切片

如上图所示,params一共6个维度,indices为[2,1,3,4]被取了出来。
转载
发布博客 2021.07.06 ·
162 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

ROC曲线理解

博主写的非常好:转自:https://www.jianshu.com/p/2ca96fce7e81
转载
发布博客 2021.07.02 ·
166 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

auc与gauc

博主写的非常好转自:https://blog.csdn.net/hnu2012/article/details/87892368在机器学习算法中,很多情况我们都是把auc当成最常用的一个评价指标,而auc反映整体样本间的排序能力,但是有时候auc这个指标可能并不能完全说明问题,有可能auc并不能真正反映模型的好坏,以CTR预估算法(推荐算法一般把这个作为一个很重要的指标)为例,把用户点击的样本当作正样本,没有点击的样本当作负样本,把这个任务当成一个二分类进行处理,最后模型输出的是样本是否被点击的概率
转载
发布博客 2021.07.02 ·
493 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

spark计算两个DataFrame的差集、交集、合集

转自:https://www.cnblogs.com/TTyb/p/7991952.htmlspark计算两个dataframe的差集、交集、合集,只选择某一列来对比比较好。新建两个dataframeimport org.apache.spark.{SparkConf, SparkContext}import org.apache.spark.sql.SQLContextdef main(args: Array[String]): Unit = { val conf = ne...
转载
发布博客 2021.07.02 ·
1550 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

Linux Shell eval

https://blog.csdn.net/her__0_0/article/details/65938894
转载
发布博客 2021.07.02 ·
159 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

linux shell中“2>&1“含义

https://www.cnblogs.com/zhenghongxin/p/7029173.html
转载
发布博客 2021.07.02 ·
135 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多