xiao4816
码龄12年
关注
提问 私信
  • 博客:77,577
    77,577
    总访问量
  • 16
    原创
  • 64,340
    排名
  • 38
    粉丝
  • 0
    铁粉
  • 学习成就
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:浙江省
  • 加入CSDN时间: 2012-06-23
博客简介:

xiao4816的博客

查看详细资料
  • 原力等级
    成就
    当前等级
    2
    当前总分
    105
    当月
    0
个人成就
  • 获得50次点赞
  • 内容获得6次评论
  • 获得55次收藏
创作历程
  • 6篇
    2024年
  • 4篇
    2023年
  • 11篇
    2016年
  • 10篇
    2015年
成就勋章
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

179人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

海外电商思考

在A平台卖的好,在B平台还没有同样的品。应该卖什么样的商品?有哪些商品相关的数据?
原创
发布博客 2024.08.19 ·
220 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

SQL面试题-留存率计算

计算的是整段时间范围内,每一天为基准的所有的留存1、2、7天的用户数。计算的是用户首次登陆时间为基准时间,计算该基准时间之后的n日留存率。方法一的优势是可以一次性计算出,每天的不同时间范围的留存率。缺点:如果要计算n天留存需要增加代码量。但是不是很直观,并且计算量比较大。优点:代码直观好理解。
原创
发布博客 2024.07.07 ·
618 阅读 ·
6 点赞 ·
1 评论 ·
3 收藏

同质人群挖掘方法总结

基于用户的特征向量,基于向量的距离,例如欧氏距离、马氏距离(
原创
发布博客 2024.07.04 ·
193 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

量化交易入门——盘口

第四是竞买和竞卖:“竞买”指的是竞相购买股票的投资者,他们愿意花更高的价格买入该股票,而“竞卖”指的是竞相出售股票的投资者,他们愿意以较低的价格卖出该股票。如果你想买入股票,当你报价高于卖1的5.07.高于5.07的的任何价位,都可以即时成交,成交价是5.07.如果你的报价是5.05.那么你就需要在5.05这个价格等候排队,直到股价跌到了5.05.你才可能有机会成交。每个炒股软件上,都会有某只个股的成交信息,在其中会出现一个五档的行情列表,里面列出了买家和卖家各五个价格及其对应的数量。最后,注意风险控制。
原创
发布博客 2024.06.13 ·
1046 阅读 ·
5 点赞 ·
0 评论 ·
6 收藏

量化交易入门——从零开始搭建自己的量化交易系统

一般的量化交易系统包含如下的功能模块参考数据收集模块数据是量化交易的基础,因此数据收集模块是整个系统的核心之一。它负责从各种数据源收集市场数据,如股票、期货、外汇等。这些数据可能包括历史价格、成交量、财务信息等。数据的质量和准确性对整个系统的表现有着至关重要的影响。数据清洗模块由于原始数据可能存在各种问题,如缺失值、异常值、重复数据等,因此需要进行数据清洗。这个模块负责对收集到的数据进行预处理,以确保数据的准确性和完整性。它通常包括数据筛选、异常值处理、缺失值填充等功能。策略回测模块。
原创
发布博客 2024.05.10 ·
1535 阅读 ·
3 点赞 ·
0 评论 ·
11 收藏

DSSM 模型技术介绍

本文属于新闻推荐实战-召回阶段-DSSM召回模型。区别于策略召回,基于向量召回也是目前工业界常用的一种召回方法。这里我们将介绍一个比较经典的召回模型DSSM,希望读者可以快速掌握模型原理以及细节,同时可以了解具体的实践过程。
原创
发布博客 2024.04.22 ·
1302 阅读 ·
18 点赞 ·
0 评论 ·
11 收藏

SentenceTransformer 之论文解读

尽管Bert和RoBERTa在句子对回归任务上,例如语义文本相似度(Semantic Text Similarity),取得了新的sota结果。但是,需要将两个句子都输入到模型中,造成较大的计算延时:在10,000个句子中需要相似的句子对,需要BERT计算50,000,000次,需要大概65个小时。因此,BERT的模型结构决定了,不适合用来做相似文本检索或者是无监督文本聚类。因此,本文提出了基于孪生网络或者三元网络结构的BERT模型,可以用来计算具有语义的句子向量,该向量可以使用余弦相似度进行比较。
原创
发布博客 2023.10.01 ·
549 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

转~京东智能推荐卖点技术

AI-flow是推荐模块,执行召回和排序,以获取推荐候选产品,根据产品的库存和受欢迎程度进行筛选,最后确定要推荐的产品同时将请求发送给卖点模块,进行卖点的提取和个性化分发。卖点精筛模型区别于粗筛模型,将生成后的卖点文案,输入到一种递归锐化的BERT模型中进行训练。用户兴趣嵌入表征:通过work2vector方式获得产品词里每个字的word embedding,将产品词中每个字的表征向量求和获取该产品词的表征,结合用户对每个产品词的喜好权重,然后对所有的产品词进行加权平均,获取用户对产品词的喜好的表征向量。
转载
发布博客 2023.09.18 ·
374 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

SentenceTransformers 之重复问题预测

基于Python库,SentenceTransformers,实现重复问题预测任务。
原创
发布博客 2023.09.13 ·
495 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Python报错:Cannot convert a symbolic Tensor (bert/encoder/strided_slice:0) to a numpy array

参考网上搜索安装numpy==1.19还是报错。
原创
发布博客 2023.09.11 ·
254 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

mysql in 子查询 效率慢 优化

解决方法:(举例)mysql> select * from abc_number_prop where number_id in (select number_id from abc_number_phone where phone = '82306839');为了节省篇幅,省略了输出内容,下同。67 rows in set (12.00 sec)只有67行数据返回,却
转载
发布博客 2016.04.13 ·
643 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

解决:Mysql exceeds the lock table size 不指定

故障现象view plainprint?mysql> delete FROM `tablesname` WHERE datetimeERROR 1206 (HY000): The total number of locks exceeds the lock table size  解决步骤1、锁表写操作view plainprint?mysql> lock ta
转载
发布博客 2016.04.12 ·
909 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

SQL :多条记录取最前面一条或根据条件任取N条。。。。。。

--按某一字段分组取最大(小)值所在行的数据/*数据如下:name val memoa    2   a2(a的第二个值)a    1   a1--a的第一个值a    3   a3:a的第三个值b    1   b1--b的第一个值b    3   b3:b的第三个值b    2   b2b2b2b2b    4   b4b4b    5  
转载
发布博客 2016.04.01 ·
1851 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

MySQL的转义字符“\”

MySQL的转义字符“\”  MySQL识别下列转义字符:     \0    一个ASCII  0  (NUL)字符。    
   一个新行符。    \t    一个定位符。    \r    一个回车符。    \b    一个退格符。    \'    一个单引号(“'”)符。    \  "    一个双引号(“  "
转载
发布博客 2016.03.31 ·
1596 阅读 ·
2 点赞 ·
0 评论 ·
1 收藏

mysql常用字符串操作函数大全,以及实例

今天在论坛中看到一个关于mysql的问题,问题如下good_id     cat_id12654         665,56912655         601,4722goods_id是商品idcat_id是分类id当我,怎么根据这种分类ID查数据(一个商品有多个分类,而且用逗号隔开了)我现在用的是like 这样的话,输入一个分类id是688,或者4722都能出来这
转载
发布博客 2016.03.31 ·
478 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

mysql update语句的用法详解

首先,单表的UPDATE语句:UPDATE [LOW_PRIORITY] [IGNORE] tbl_nameSET col_name1=expr1 [, col_name2=expr2 ...][WHERE where_definition][ORDER BY ...][LIMIT row_count]其次,多表的UPDATE语句: UPDATE [LO
转载
发布博客 2016.03.31 ·
2686 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏

c++中vector的用法详解

vector(向量): C++中的一种数据结构,确切的说是一个类.它相当于一个动态的数组,当程序员无法知道自己需要的数组的规模多大时,用其来解决问题可以达到最大节约空间的目的.     用法:          1.文件包含:                首先在程序开头处加上#include以包含所需要的类文件vector          还有一定要加上
原创
发布博客 2016.03.12 ·
441 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

C++ 购物车代码

//good.h#ifndef _GOOD_H#define _GOOD_H#include using std::string;class good{ private: string goodname; //唯一标识商品 double price; //价格 double rate; //折扣率 public: good(){ //无参构造函数 go
转载
发布博客 2016.03.12 ·
2057 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

scrapy爬虫代理——利用crawlera神器,无需再寻找代理IP

由于工作需要,利用scrpay采集某个商业网站的数据。但是这个网站反扒非常厉害。因此不得不采用代理IP来做,但是做了几天后几乎能用的代理IP全被禁掉了。而且这种找代理、然后再验证的流程非常麻烦,于是博主想到了第三方平台crawlera.
转载
发布博客 2016.02.10 ·
20917 阅读 ·
3 点赞 ·
2 评论 ·
23 收藏

常见的反爬虫和应对方法

0x01 常见的反爬虫这几天在爬一个网站,网站做了很多反爬虫工作,爬起来有些艰难,花了一些时间才绕过反爬虫。在这里把我写爬虫以来遇到的各种反爬虫策略和应对的方法总结一下。从功能上来讲,爬虫一般分为数据采集,处理,储存三个部分。这里我们只讨论数据采集部分。一般网站从三个方面反爬虫:用户请求的Headers,用户行为,网站目录和数据加载方式。前两种比较容易遇到,大多数网站都
转载
发布博客 2016.02.10 ·
1127 阅读 ·
2 点赞 ·
0 评论 ·
1 收藏
加载更多