SparrowRecSys学习笔记(一)

GitHub地址:SparrowRecSys @王喆

简介

SparrowRecSys是较为完善的推荐系统,包括工程结构、深度推荐模型、多路召回、排序等部分;推荐包括online、nearlin、offline。

技术栈

TensorFlow:搭建Model、部署上线(通过TensorFlow serving)

Flink:批处理

Spark:数据处理和基本模型搭建、训练

Redis:内存数据库,保存embedding数据,供online推荐使用

Jetty:java实现的轻量级服务器

前端部分:HTML、CSS、JS

技术架构

关键过程

推荐系统的主要关键过程包括:读取候选物品、多路召回、排序、补充算法、生成候选物品列表。召回recall和排序sort是核心。 

  • 召回

从候选物品集合(千万、百万量级)中筛选出少量的物品(万、千量级),目的是提高实时性。

  • 排序

对召回的物品打分,取高分的前N个(百、十)生成结果。在工程实践中,会使用多路召回,即使用很多种不同的召回策略,join生成候选集;排序之后的结果也会针对实时性、召回物品的特征进行筛选、打散等操作。

  • offline:

使用全量数据训练复杂的Model,复杂意味着更高的查准率(recall)和查全率(precision),也意味着更长的训练时间,更多的参数,更大的模型。在实际的工程中,内存可能会成为瓶颈,同时也限制了端上智能(可以简单理解为APP上的神经网络)。

技术选型:spark

  • online:

实时性强,表现在两个方面:模型处理速度快;能够响应用户的最新操作。一般使用低复杂度的算法。

技术选型:基于规则的推荐

  • nearline

通过时间窗口对一段时间的缓存数据进行批处理,处于offline和online中间。

技术选型:Flink

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
当然,我可以帮你输出一篇Selenium学习笔记。以下是一份简单的学习笔记供参考: Selenium学习笔记 Selenium是一款用于自动化Web应用程序测试的强大工具。它提供了一组丰富的API,可以与各种编程语言(如Python、Java、C#等)结合使用,以实现Web应用程序的自动化测试。 1. 安装和配置 首先,你需要安装Selenium库。如果你使用Python,可以使用以下命令安装: ``` pip install selenium ``` 安装完成后,你还需要下载并配置相应的浏览器驱动程序。Selenium支持各种浏览器,如Chrome、Firefox、Safari等。你可以在Selenium官方网站上找到相应的驱动程序下载链接。 2. 基本操作 Selenium提供了一系列方法来模拟用户在浏览器中的操作,如打开URL、点击元素、输入文本等。以下是一些常用的基本操作示例: - 打开浏览器并访问URL: ```python from selenium import webdriver driver = webdriver.Chrome() # 使用Chrome浏览器驱动 driver.get("https://www.example.com") # 打开指定URL ``` - 查找元素并操作: ```python element = driver.find_element_by_id("element_id") # 根据元素ID查找 element.click() # 点击元素 input_element = driver.find_element_by_name("input_name") # 根据元素名称查找 input_element.send_keys("Hello, World!") # 输入文本 ``` - 执行JavaScript代码: ```python driver.execute_script("window.scrollTo(0, document.body.scrollHeight);") # 滚动到页面底部 ``` 3. 高级操作 Selenium还提供了一些高级操作,如处理弹窗、切换窗口、等待元素加载等。以下是一些常用的高级操作示例: - 处理弹窗: ```python alert = driver.switch_to.alert # 切换到弹窗 alert.accept() # 接受弹窗 confirm = driver.switch_to.alert # 切换到确认框 confirm.dismiss() # 取消确认框 ``` - 切换窗口: ```python window_handles = driver.window_handles # 获取所有窗口句柄 driver.switch_to.window(window_handles[-1]) # 切换到最后一个窗口 ``` - 等待元素加载: ```python from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC element = WebDriverWait(driver, 10).until( EC.presence_of_element_located((By.ID, "element_id")) ) ``` 4. 测试框架 Selenium还可以与测试框架(如Pytest、JUnit等)结合使用,以便更好地组织和管理测试用例。你可以使用测试框架提供的断言方法来验证测试结果。 ```python import pytest def test_example(): driver = webdriver.Chrome() driver.get("https://www.example.com") assert "Example Domain" in driver.title # 断言页面标题包含指定文本 driver.quit() ``` 以上是一份简单的Selenium学习笔记,希望对你有所帮助。当然,Selenium还有很多其他功能和用法,你可以进一步深入学习和探索。祝你学习愉快!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值