a_void
码龄9年
关注
提问 私信
  • 博客:20,099
    20,099
    总访问量
  • 10
    原创
  • 2,082,879
    排名
  • 14
    粉丝
  • 0
    铁粉

个人简介:Do it once, do it better

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:浙江省
  • 加入CSDN时间: 2016-08-01
博客简介:

Time flys

查看详细资料
  • 原力等级
    当前等级
    0
    当前总分
    20
    当月
    0
个人成就
  • 获得22次点赞
  • 内容获得1次评论
  • 获得55次收藏
创作历程
  • 1篇
    2024年
  • 1篇
    2020年
  • 8篇
    2019年
成就勋章
TA的专栏
  • 数据仓库
    7篇
  • 数据分析
    1篇
  • 前端学习
    1篇
兴趣领域 设置
  • 人工智能
    神经网络pytorch
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

DataWhale的ChatGLM与SD项目实践

花钱做推广,新用户送168个算力点,然后通过自行部署chatglm和stable-diffustion-webui,来帮助新手了解这两个东西。我之前都玩过,所以就是随便看看。教程中需要注意的是,会ssh的最好在系统那里配置一下ssh连接,方法写代码。参与了DataWhale组织的chatGLM与SD项目实践,要打卡记录学习结果。
原创
发布博客 2024.03.13 ·
387 阅读 ·
8 点赞 ·
0 评论 ·
8 收藏

字符串翻转之谜

做内容安全审查时,发现了一个奇怪的case。 明明用户的评论中含有敏感词,但是用关键词匹配却无法匹配成功。就好像like这个匹配方法失效了一样。sql select '一个敏感词啊' like '%敏感词%' -- 结果竟然为false用肉眼是无法看出问题的,把评论以文件形式下载到本地,用vim打开,才发现,原来文本的顺序是错乱的!见下图以这一段文本为例,<202d><202e>耳木<202c><202c>品质差别<202d><202e
原创
发布博客 2020.05.27 ·
2265 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

Hive如何比较复杂数据类型

Hive中的复杂数据类型,比如array,struct, map能进行大小的比较吗,我们先来做实验看看结果。Arrayselect max(arr)from ( select array(1,3,5) as arr union all select array(2,4,1) as arr union all select array(2,3,5) as arr ...
原创
发布博客 2019.12.24 ·
2673 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

使用hive制作一张日历表

如何做一张能支持标注中国节假日的日历表呢,话不多说见Code~with festival as ( select f.`date` as festival_date, f.name as festival_name, if(f.not_work == 'yes', True, False) as not_work from ( select array(...
原创
发布博客 2019.12.24 ·
2035 阅读 ·
2 点赞 ·
1 评论 ·
1 收藏

问题解决: Spark无法读取有多个子目录的Parquet表

问题解决: Spark无法读取有多个子目录的Parquet表用tez做数据处理时,免不了要用union all来整合多个数据源的数据。但是如果最后一步是union all的话,就会生成多个子目录,这时用Spark就可能无法读取到子目录中的内容(取决于spark的配置)。这个问题的原因是tez的union all是并行去做的,为了避免文件的冲突,tez写到了多个子目录里面。解决这个问题有两个方向...
原创
发布博客 2019.12.13 ·
1512 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

怎么用SQL计算可能认识的人

怎么用SQL计算可能认识的人用户关系数据可以有很多应用,比如说好友动态PUSH,朋友圈兴趣发现,好友推荐等等。推荐可能认识的人,属于好友推荐的一种。平台应该把沉淀、培养用户关系作为平台的目标之一。当用户在平台上积累了足够的关系网,用户离开平台的沉没成本就变得很大,所以你看现在人们已经离不开微信。可能认识的人,主要是基于用户的好友关系计算。假设有用户A,B,C其中AB是朋友,AC也是朋友,那...
原创
发布博客 2019.12.10 ·
799 阅读 ·
2 点赞 ·
0 评论 ·
7 收藏

那些提供Jupyter Notebook服务平台们

那些提供Jupyter Notebook服务平台们Jupyter Notebook 最开始只是用来方便交互式执行pyhton命令,由于其交互性强、美观易懂,所呈现内容符合思考习惯,经过多年的发展,jupyter notebook已经成为教学、分享、工作中常用的工具。人们也对notebook这种形式做了拓展,不只有python,还可以运行scala、spark、sql、机器学习等等一系列扩展。前几...
原创
发布博客 2019.12.03 ·
674 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

JS捕获onclick与onsubmit等事件

JS捕获onclick与onsubmit等事件有时候,用户点击一个按钮,提交一个表单,我们需要先对用户填写的内容做验证,然后再决定是否允许用户提交。这里给出两种捕获事件,决定是否允许用户进行下一步操作的方法。使用event.preventDefault()<a href="" id="undo">undo</a>document.getElementById("u...
原创
发布博客 2019.11.28 ·
484 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

计算互相关注的SQL应该怎么写

#计算互相关注的SQL应该怎么写用户好友关系是一个产品的核心数据,只允许互相关注的用户之间发消息称为强关系型产品,比如微信;反之,不互相关注也能看到动态,比如微博,就是弱关系型产品因为微信的存在,现在基本能做大的都是社区型的,弱关系型的产品了。所以互联网公司就很容易碰到,从单向关注数据中计算是否双向关注这种需求。假设现在有一张表,叫table_relation里面只有两个字段,from_us...
原创
发布博客 2019.11.27 ·
4139 阅读 ·
9 点赞 ·
0 评论 ·
22 收藏

如何高效计算用户留存率

如何高效计算用户留存率简单介绍留存率的概念,说明数仓建设中对留存率计算的优化思路什么是留存率在互联网行业中,用户在某段时间内开始使用应用,经过一段时间后,仍然继续使用该应用的用户,被认作是留存用户。留存率就是留存用户与全部用户的比值,计算公式留存率 = 留存用户数 / 用户数 * 100%比如昨天来了100个人,今天这100个人里面的60个人又来了,那么留存率就是60%。留存率...
原创
发布博客 2019.10.24 ·
5116 阅读 ·
0 点赞 ·
0 评论 ·
8 收藏