coding技巧
文章平均质量分 59
日常工作中的编程技巧
菩提树下的呆子
分享所想分享的
展开
-
openai function call stream调用指南
对于function call,我们会调用两次openai接口,如果有function需要调用的情况下,如果没有就只会调用一次openai接口。原创 2024-03-25 10:33:17 · 1594 阅读 · 0 评论 -
怎么样才能在Python中确保对象只能一个被实例化
单例模式是一种设计模式,它限制了一个类只能有一个实例。当整个系统中需要一个协调各个部分的唯一对象时,这种设计模式就非常有用。例如,配置管理器、日志记录器或者数据库连接池等场景都可能需要单例模式来实现。原创 2023-04-25 19:22:55 · 962 阅读 · 1 评论 -
小驼峰命名法编程规范
编程规范js函数编码规范1.方法名统一用小驼峰,如printHelloWorld ()2.函数名与括号隔一个空格如printHelloWorld ()3.函数体开始的花括号不换行 如function printHelloWorld () {}4.类名统一使用大驼峰如class TestMe {}golang与js开发变量命名规范变量统一以小驼峰命名,如szText,nRresult,所有变量统一加上变量前缀作为标记,变量前缀如下前缀意义举例b布尔bSucce原创 2021-12-10 16:51:38 · 1466 阅读 · 0 评论 -
如何构建数字签名密钥?
数字签名为保证数据传输过程中的数据真实性,完整性和不可抵赖,我们需要对数据进行数字签名,在接收接口请求后进行签名校验。签名机制如下:采用MD5 产生签名摘要。待签名原文是各请求参数的值按照文档中自上而下的顺序组拼装成的字符串,不包括 sign 本身,如果字段值为空或者字段不存在则参数不参与拼装。sign=MD5(参数1+参数2+…+参数n+key),其中key 为用户秘钥(可以为任意字符的md5转换,也可以是其它的)。base64 编码的字符集为 UTF-8。输出结果为 32 位大写字符串原创 2022-03-01 18:14:47 · 732 阅读 · 0 评论 -
从上亿条数据中过滤两百万条数据信息,你会怎么做?
【业务梳理】背景就是要从上亿条数据中过滤出被封禁的用户,如何处理补充在第5部会使用must和mustnot命令过滤数据到前端展示【实现方式】本地测试环境,自己搭建了本地的elasticsearch,elasticsearch-head-master和kibana进行本地开发测试,需要加的逻辑主要在向redis拿到任务后去业务数据库中补充相关字段比如被封禁的用户信息,主贴被删的信息等等,然后在运行时发现被封禁的用户信息量在两百万左右,大量的数据信息需要做优化。一开始主要是采用了将被封禁的用户信息先原创 2022-02-24 11:58:22 · 1467 阅读 · 0 评论 -
Mysql分页查询优化
前提都是uid是唯一的且单调增的1.利用pagenum来分页select * from uc_members where (safety=-1 or safety=-2) and uid > pagenum *10 limit1000;存在一个问题 pagenum 如何确定,使用select count(1) 进行统计然后在for循环传入pagenum实现分页效果,那在for循环中如果遇到新增的数据怎么办?难道for到最后一个在去select count(1) 一下,如果两个不一致就进行for原创 2022-02-23 18:10:07 · 557 阅读 · 0 评论 -
makedown过滤标签解决黑产内容通过<>规避词库检测的问题
makedown过滤标签解决黑产内容通过<>规避词库检测的问题【需求背景】用户发布的内容中包含富文本内容,包括a标签,img标签等,为了提升词库检测的准确性,目前在做词库检测之前,通过hutool的HtmlUtil.cleanHtmlTag将待检测文本进行过滤。但cleanHtmlTag未校验标签的合法性,会存在误操作,比如:会将所有"<“和”>"包裹的内容全部过滤,导致被黑产利用发布违规内容。例如:<英超比赛在哪押注{C><网-Ag886.cn-网&原创 2022-02-23 10:26:15 · 396 阅读 · 0 评论 -
布隆过滤器总结
布隆过滤器就是把数据通过hash函数计算出来标记在不同的位置然后查找的时候也是用hash函数算出值,去找一下1,4,7上的数据是不是1,不是1的话就不存在存入布隆过滤器的缺点就是不可以删除数据,但是与set不同在于可以加入重复的数据,因为其原理就是通过hash算法分散到不同的位置进行标记,重复只不过是重复了上述过程。布隆过滤器使用场景场景一:当前需要维护一个内存,去存储uid这个字段,可是这个字段数据量比较大可能有两百万左右,那么一个integer占用16个字节,hashset要16个字节,一共原创 2022-02-22 14:01:01 · 299 阅读 · 2 评论