自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 量化交易入门——盘口

第四是竞买和竞卖:“竞买”指的是竞相购买股票的投资者,他们愿意花更高的价格买入该股票,而“竞卖”指的是竞相出售股票的投资者,他们愿意以较低的价格卖出该股票。如果你想买入股票,当你报价高于卖1的5.07.高于5.07的的任何价位,都可以即时成交,成交价是5.07.如果你的报价是5.05.那么你就需要在5.05这个价格等候排队,直到股价跌到了5.05.你才可能有机会成交。每个炒股软件上,都会有某只个股的成交信息,在其中会出现一个五档的行情列表,里面列出了买家和卖家各五个价格及其对应的数量。最后,注意风险控制。

2024-06-13 23:44:15 512

原创 量化交易入门——从零开始搭建自己的量化交易系统

一般的量化交易系统包含如下的功能模块参考数据收集模块数据是量化交易的基础,因此数据收集模块是整个系统的核心之一。它负责从各种数据源收集市场数据,如股票、期货、外汇等。这些数据可能包括历史价格、成交量、财务信息等。数据的质量和准确性对整个系统的表现有着至关重要的影响。数据清洗模块由于原始数据可能存在各种问题,如缺失值、异常值、重复数据等,因此需要进行数据清洗。这个模块负责对收集到的数据进行预处理,以确保数据的准确性和完整性。它通常包括数据筛选、异常值处理、缺失值填充等功能。策略回测模块。

2024-05-10 21:31:38 454

原创 DSSM 模型技术介绍

本文属于新闻推荐实战-召回阶段-DSSM召回模型。区别于策略召回,基于向量召回也是目前工业界常用的一种召回方法。这里我们将介绍一个比较经典的召回模型DSSM,希望读者可以快速掌握模型原理以及细节,同时可以了解具体的实践过程。

2024-04-22 15:13:09 812

原创 SentenceTransformer 之论文解读

尽管Bert和RoBERTa在句子对回归任务上,例如语义文本相似度(Semantic Text Similarity),取得了新的sota结果。但是,需要将两个句子都输入到模型中,造成较大的计算延时:在10,000个句子中需要相似的句子对,需要BERT计算50,000,000次,需要大概65个小时。因此,BERT的模型结构决定了,不适合用来做相似文本检索或者是无监督文本聚类。因此,本文提出了基于孪生网络或者三元网络结构的BERT模型,可以用来计算具有语义的句子向量,该向量可以使用余弦相似度进行比较。

2023-10-01 10:39:55 333

转载 转~京东智能推荐卖点技术

AI-flow是推荐模块,执行召回和排序,以获取推荐候选产品,根据产品的库存和受欢迎程度进行筛选,最后确定要推荐的产品同时将请求发送给卖点模块,进行卖点的提取和个性化分发。卖点精筛模型区别于粗筛模型,将生成后的卖点文案,输入到一种递归锐化的BERT模型中进行训练。用户兴趣嵌入表征:通过work2vector方式获得产品词里每个字的word embedding,将产品词中每个字的表征向量求和获取该产品词的表征,结合用户对每个产品词的喜好权重,然后对所有的产品词进行加权平均,获取用户对产品词的喜好的表征向量。

2023-09-18 09:57:01 250

原创 SentenceTransformers 之重复问题预测

基于Python库,SentenceTransformers,实现重复问题预测任务。

2023-09-13 17:18:56 289

原创 Python报错:Cannot convert a symbolic Tensor (bert/encoder/strided_slice:0) to a numpy array

参考网上搜索安装numpy==1.19还是报错。

2023-09-11 09:57:08 192

转载 mysql in 子查询 效率慢 优化

解决方法:(举例)mysql> select * from abc_number_prop where number_id in (select number_id from abc_number_phone where phone = '82306839');为了节省篇幅,省略了输出内容,下同。67 rows in set (12.00 sec)只有67行数据返回,却

2016-04-13 13:35:53 607

转载 解决:Mysql exceeds the lock table size 不指定

故障现象view plainprint?mysql> delete FROM `tablesname` WHERE datetimeERROR 1206 (HY000): The total number of locks exceeds the lock table size  解决步骤1、锁表写操作view plainprint?mysql> lock ta

2016-04-12 22:17:28 847

转载 SQL :多条记录取最前面一条或根据条件任取N条。。。。。。

--按某一字段分组取最大(小)值所在行的数据/*数据如下:name val memoa    2   a2(a的第二个值)a    1   a1--a的第一个值a    3   a3:a的第三个值b    1   b1--b的第一个值b    3   b3:b的第三个值b    2   b2b2b2b2b    4   b4b4b    5  

2016-04-01 15:30:56 1817

转载 MySQL的转义字符“\”

MySQL的转义字符“\”  MySQL识别下列转义字符:     \0    一个ASCII  0  (NUL)字符。    \n    一个新行符。    \t    一个定位符。    \r    一个回车符。    \b    一个退格符。    \'    一个单引号(“'”)符。    \  "    一个双引号(“  "

2016-03-31 22:28:56 1510

转载 mysql常用字符串操作函数大全,以及实例

今天在论坛中看到一个关于mysql的问题,问题如下good_id     cat_id12654         665,56912655         601,4722goods_id是商品idcat_id是分类id当我,怎么根据这种分类ID查数据(一个商品有多个分类,而且用逗号隔开了)我现在用的是like 这样的话,输入一个分类id是688,或者4722都能出来这

2016-03-31 22:28:08 456

转载 mysql update语句的用法详解

首先,单表的UPDATE语句:UPDATE [LOW_PRIORITY] [IGNORE] tbl_nameSET col_name1=expr1 [, col_name2=expr2 ...][WHERE where_definition][ORDER BY ...][LIMIT row_count]其次,多表的UPDATE语句: UPDATE [LO

2016-03-31 22:27:00 2601

原创 c++中vector的用法详解

vector(向量): C++中的一种数据结构,确切的说是一个类.它相当于一个动态的数组,当程序员无法知道自己需要的数组的规模多大时,用其来解决问题可以达到最大节约空间的目的.     用法:          1.文件包含:                首先在程序开头处加上#include以包含所需要的类文件vector          还有一定要加上

2016-03-12 19:44:05 418

转载 C++ 购物车代码

//good.h#ifndef _GOOD_H#define _GOOD_H#include using std::string;class good{ private: string goodname; //唯一标识商品 double price; //价格 double rate; //折扣率 public: good(){ //无参构造函数 go

2016-03-12 19:35:03 1887

转载 scrapy爬虫代理——利用crawlera神器,无需再寻找代理IP

由于工作需要,利用scrpay采集某个商业网站的数据。但是这个网站反扒非常厉害。因此不得不采用代理IP来做,但是做了几天后几乎能用的代理IP全被禁掉了。而且这种找代理、然后再验证的流程非常麻烦,于是博主想到了第三方平台crawlera.

2016-02-10 18:40:07 20725 2

转载 常见的反爬虫和应对方法

0x01 常见的反爬虫这几天在爬一个网站,网站做了很多反爬虫工作,爬起来有些艰难,花了一些时间才绕过反爬虫。在这里把我写爬虫以来遇到的各种反爬虫策略和应对的方法总结一下。从功能上来讲,爬虫一般分为数据采集,处理,储存三个部分。这里我们只讨论数据采集部分。一般网站从三个方面反爬虫:用户请求的Headers,用户行为,网站目录和数据加载方式。前两种比较容易遇到,大多数网站都

2016-02-10 18:28:13 1042

转载 零基础写python爬虫之使用Scrapy框架编写爬虫

网络爬虫,是在网上进行数据抓取的程序,使用它能够抓取特定网页的HTML数据。虽然我们利用一些库开发一个爬虫程序,但是使用框架可以大大提高效率,缩短开发时间。Scrapy是一个使用Python编写的,轻量级的,简单轻巧,并且使用起来非常的方便。使用Scrapy可以很方便的完成网上数据的采集工作,它为我们完成了大量的工作,而不需要自己费大力气去开发。首先先要回答一个问题。问:把网站装进爬虫

2016-01-18 23:01:58 1089

原创 废柴

你我,只不过想把一生过好。有时候就会这样,遇到不顺,心情低落,特别想做一只废柴,逃避能力越大,责任越大的托词,逃避一人肩负的任务,变成芝士面包、法式长棍或是缱绻的猫,流浪的狗。还不是因为没有做好而自知,当别人向我倾诉的时候,当别人向我抱怨的时候,当别人向我吐苦水的时候,过去的我会说,这人真矫情、为什么总是向我吐槽负面情绪;现在我却感到幸福

2015-12-24 10:02:17 16889 1

转载 Mysql in子查询效率慢的解决方法

现在的CMS系统、博客系统、BBS等都喜欢使用标签tag作交叉链接,因此我也尝鲜用了下。但用了后发现我想查询某个tag的文章列表时速度很慢,达到5秒之久!百思不解(后来终于解决),我的表结构是下面这样的,文章只有690篇。文章表article(id,title,content)标签表tag(tid,tag_name)标签文章中间表article_tag(id,tag_id,arti

2015-12-16 22:12:13 1723

原创 MYSQL使用inner join 进行 查询/删除/修改示例

mysql 使用inner join对表进行修改代码如下:--查询 SELECT tp.tp_id, tp.tpmc, tp.leveid, tp.tpdz, tp.jgm, tp.scsj, tp.pbzyid, tp.ksbfsj, tp.jsbfsj, tp.status, tp.tpbz FROM qdgl_tupian tp INNER JOIN qdgl_pqb p

2015-12-12 01:23:51 659

转载 mysql insert操作

insert的语法INSERT [LOW_PRIORITY | DELAYED | HIGH_PRIORITY] [IGNORE] [INTO] tbl_name [(col_name,...)] VALUES ({expr | DEFAULT},...),(...),... [ ON DUPLICATE KEY UPDATE col_name=expr, ..

2015-12-11 23:46:48 450

原创 Group By和Having,Where,Order by语句的执行顺序

Group By和Having,Where,Order by语句的执行顺序 一个SQL语句往往会产生多个临时视图,那么这些关键字的执行顺序就非常重要了,因为你必须了解这个关键字是在对应视图形成前的字段进行操作还是对形成的临时视图进行操作,这个问题在使用了别名的视图尤其重要。 Group By 和 Having, Where ,Order by这些关键字是按照如下顺序进行执行的:Wh

2015-12-11 23:38:08 758

转载 sql取记录中的第一条或是最大的一条

--按某一字段分组取最大(小)值所在行的数据/*数据如下:name val memoa    2   a2(a的第二个值)a    1   a1--a的第一个值a    3   a3:a的第三个值b    1   b1--b的第一个值b    3   b3:b的第三个值b    2   b2b2b2b2b    4   b4b4b    5   b5

2015-12-11 23:21:51 8115

原创 mysql中UNIX_TIMESTAMP和FROM_UNIXTIME时间戳

select unix_timestamp('2012-07-30 20:54:12');返回1970-1-1 8:00:00开始到date所代表的时间为止的秒数;from_unixtime把时间戳转化成date;

2015-12-11 23:04:56 459

转载 mysql数据库优化总结

1. 优化你的MySQL查询缓存在MySQL服务器上进行查询,可以启用高速查询缓存。让数据库引擎在后台悄悄的处理是提高性能的最有效方法之一。当同一个查询被执行多次时,如果结果是从缓存中提取,那是相当快的。但主要的问题是,它是那么容易被隐藏起来以至于我们大多数程序员会忽略它。在有些处理任务中,我们实际上是可以阻止查询缓存工作的。复制代码 代码如下: // query cache

2015-12-11 22:53:45 515

原创 杂想

因为经历过许多,所以明白有些话不会说破,所以她才接受了一些哀伤,接受了一些无能为力。所以她才有了与别人不同的那一点点寂寥,一点点冷漠,一点点倔强,一点点胡闹,一点点天真,一点点野蛮,一点点坚持,一点点随便,一点点不愿点明的心愿。当我不想忘记也不想曾经,但是没有资格说出我爱你。

2015-12-11 22:10:32 363

原创 Mysql问题及解决——Error code2014

问题描述:使用mysql workbench执行一段存储过程,如下,实现分段插入的功能,但是会出现Error Code: 2014 Commands out of sync; you can't run this command now,设定SQL editor——Query Editor——Max number of result set:从10改到500,会出现同样的错误,但是出现的时

2015-12-10 22:24:35 2837 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除