自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

专注大数据与人工智能技术分享,欢迎私信加群互相学习!

强烈推荐博主的知识星球: GoAI的学习社区 CV、NLP、大模型、多模态、AIGC、大数据

  • 博客(15)
  • 资源 (8)
  • 问答 (1)
  • 收藏
  • 关注

原创 深度学习推荐模型-DIN

深度学习推荐模型-DIN本文参考链接,仅供个人学习:https://github.com/datawhalechina/team-learning-rs/tree/master/DeepRecommendationModel相关学习书籍推荐:《深度学习推荐系统》王喆DIN介绍Deep Interest Network(DIN)是盖坤大神领导的阿里妈妈的精准定向检索及基础算法团队,在2017年6月提出的。它针对电子商务领域(e-commerce industry)的CTR预估,重点在

2021-03-27 20:48:16 653

原创 深度学习推荐模型-NFM

深度学习推荐模型-NFM本文参考链接,仅供个人学习:https://github.com/datawhalechina/team-learning-rs/tree/master/DeepRecommendationModel相关学习书籍推荐:《深度学习推荐系统》王喆

2021-03-25 00:16:58 585

原创 深度学习推荐模型-DeepFM

深度学习推荐模型-DeepFM本文参考链接,仅供个人学习:https://github.com/datawhalechina/team-learning-rs/tree/master/DeepRecommendationModel相关学习书籍推荐:《深度学习推荐系统》王喆

2021-03-21 17:54:49 644

原创 深度学习推荐模型-Wide&Deep

本文参考链接,仅供个人学习:https://github.com/datawhalechina/team-learning-rs/tree/master/DeepRecommendationModel相关学习书籍推荐:《深度学习推荐系统》王喆Wide & Deep介绍Wide & Deep ModelMemorization:之前大规模稀疏输入的处理是:通过线性模型 + 特征交叉。所带来的Memorization以及记忆能力非常有效和可解释。但是Generalizat.

2021-03-18 20:31:48 380

原创 大数据常见运维问题汇总

大数据常见运维问题汇总其他安装问题:1.IDEA安装与配置https://blog.csdn.net/qq_27093465/article/details/774491172.IntelliJ IDEA 修改maven为阿里云仓库https://blog.csdn.net/u013541411/article/details/1001667123.Mysql安装:https://blog.csdn.net/qq_36582604/article/details/80526287

2021-03-16 20:05:56 1670 1

原创 深度学习推荐模型-DeepCrossing

深度学习推荐模型-DeepCrossing背景特征工程是绕不开的话题,巧妙的特征组合也许能够为模型带来质的提升。但同时,特征工程耗费的资源也是相当可观的,对于后期模型特征的维护、模型线上部署不太友好。2016年,微软提出Deep Crossing模型,旨在解决特征工程中特征组合的难题,降低人力特征组合的时间开销,通过模型自动学习特征的组合方式,也能达到不错的效果,且在各种任务中表现出较好的稳定性。与之前介绍的FNN、PNN不同的是,Deep Crossing并没有采用显式交叉特征的方式,而是利用

2021-03-16 10:58:41 628

原创 情感分析-SnowNLP

情感分析SnowNLP  SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。注意本程序都是处理的unicode编码,所以使用时请自行decode成unicode。安装pip install snownlp主要用法# 导入SnowNLP.

2021-03-13 14:33:56 607

转载 机器学习-决策树(XGBoost、LightGBM)

【机器学习】决策树——XGBoost、LightGBM主要介绍基于 Boosting 框架的主流集成算法,包括 XGBoost 和 LightGBM。1. XGBoostXGBoost 是大规模并行 boosting tree 的工具,它是目前最快最好的开源 boosting tree 工具包,比常见的工具包快 10 倍以上。Xgboost 和 GBDT 两者都是 boosting 方法,除了工程实现、解决问题上的一些差异外,最大的不同就是目标函数的定义。故本文将从数学原理和工程实现上...

2021-03-12 10:56:56 1681

原创 leetcode笔记(Python版)待更新

1.反转链表:class Solution:# 返回ListNodedef ReverseList(self, pHead):# write code hereif pHead == None or pHead.next == None:#若链表为空或只有一个数就直接返回0return pHeadpre = None#定义一个空链表while pHead:...

2021-03-09 12:30:44 196 1

原创 TF-IDF算法

一. 什么是TF-IDFTF-IDF(Term Frequency-Inverse Document Frequency, 词频-逆文件频率).是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。上述引用总结就是, 一个词语在一篇文章中出现次数越多, 同时在所有文档中出现次数越少, 越能够代表该文章.这也就是

2021-03-08 16:14:16 1121

原创 Pandas学习导图

Pandas在线学习网站(强烈推荐):http://joyfulpandas.datawhale.club/Content/ch1.htmlPandas学习导图

2021-03-04 21:52:22 145 1

转载 机器学习-逻辑回归

机器学习-逻辑回归(非常详细)1. 模型介绍Logistic Regression 虽然被称为回归,但其实际上是分类模型,并常用于二分类。Logistic Regression 因其简单、可并行化、可解释强深受工业界喜爱。Logistic 回归的本质是:假设数据服从这个分布,然后使用极大似然估计做参数的估计。1.1 Logistic 分布Logistic 分布是一种连续型的概率分布,其分布函数和密度函数分别为:其中,表示位置参数,为形状参数。我们可以看下其图像特征:...

2021-03-04 12:23:10 530 1

原创 机器学习-决策树(ID3、C4.5、CART)

机器学习-决策树(上)——ID3、C4.5、CART决策树是一个非常常见并且优秀的机器学习算法,它易于理解、可解释性强,其可作为分类算法,也可用于回归模型。对于基本树我将大致从以下四个方面介绍每一个算法:思想、划分标准、剪枝策略,优缺点。1. ID3ID3 算法是建立在奥卡姆剃刀(用较少的东西,同样可以做好事情)的基础上:越是小型的决策树越优于大的决策树。1.1 思想从信息论的知识中我们知道:信息熵越大,从而样本纯度越低,。ID3 算法的核心思想就是以信息增益来度量特征选择,选择信息

2021-03-02 23:25:13 463

原创 大数据开发笔记(九):Flink综合学习

Flink基础Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。并且 Flink 提供了数据分布、容错机制以及资源管理等核心功能。Flink提供了诸多高抽象层的API以便用户编写分布式任务:

2021-03-01 13:22:50 2431

原创 大数据开发笔记(九):Flink基础

Flink: 分布式、高性能框架,支持实时模式和批处理模式一、Apache Flink作为一款高吞吐量、低延迟的针对流数据和批数据的分布式实时处理引擎和Storm/Spark Streaming一样,定位于流式处理系统区别:– Storm:速度快,低延迟,吞吐能力低,无法保证精确一致性,必须..

2021-03-01 13:19:29 1509 1

Typora 1.4.8免费版

Typora 是一款由 Abner Lee 开发的轻量级 Markdown 编辑器,与其他 Markdown 编辑器不同的是,Typora 没有采用源代码和预览双栏显示的方式,而是采用所见即所得的编辑方式,实现了即时预览的功能,但也可切换至源代码编辑模式。 Typora目前已收费,新用户免费体验15天,本次提供免费版Typora 1.4.8,可供大家学习。

2023-02-06

数据标注工具Labelme中文版

数据标注工具labelme中文版,适合用于目标检测与分割任务的相关数据集制作,提供json数据格式及转换功能。其功能方便快捷,提供一键执行程序,无需额外下载其他安装包。

2023-01-31

深度学习OCR论文方法总结

内容概要:整理自网上开源OCR资料,主要整理近几年OCR论文通用方法,结合多个指标对比可选择适合算法,包括有无代码、数据集是否规则、方法内容、识别效果指标等,资料比较全面,配合本博主的博客可以进一步详细学习,希望大家可以互相交流学习。 适合人群:OCR初学者及爱好者学习和研究。 能学到什么:快速了解整个OCR领域论文通用方法,通过不同方法对比可选择适合自己数据集的OCR识别方法,可以为科研或项目提供帮助。 阅读建议:可通过表格筛选工具选择自己想要的方法,横向和纵向对比,先找到方法,后查找对应论文详细内容,有助于快速了解OCR方法。强烈推荐大家学习.

2023-01-14

ML Visuals.pptx

深度学习方向绘图模板,包含超过100多页的PPT,非常适合各类网络的绘图!大家可以在上面可以直接使用画出你要的机器学习深度学习模型图,比如想画一个基于Transformer的模型的图,可以直接在上面修改,非常方便。推荐收藏!

2023-01-01

paddle-pytorch API对应表

详细提供pytorch绝大多数函数与paddle的对应关系,可供初学者学习paddle。

2022-02-27

python自动化办公手册.pdf

python自动化办公手册pdf ,更多Pyhon自动化学习可参考我的这篇文章:https://blog.csdn.net/qq_36816848/article/details/118077191

2022-01-09

recommended_system.zip

各类推荐算法图表详解,含传统CTR、深度学习CTR及多任务学习等。图表包括原理、特点、公式、结构及相关扩展等。

2021-04-06

flink学习.rar

资源包含Flink学习及实战pdf文件,适合快速上手flink

2021-03-01

大数据学习书签.html

整整两年大数据学习各类优秀网站资料收集,包括hadoop、hdfs、yarn、hive、hbase、flume、kafka、flink\spark、sqoop、mysql、ELK等各类大数据组件及遇到的运维问题总结。

2021-02-08

SPSS保险数据分析.rar

包括Python保险数据分析、SPSS各类保险案例流程及SPSS学习分享。

2021-02-08

数仓经典销售案例.zip

数仓经典销售案例,包括ETL脚本,项目完整详细需求、设计文档及模型加载,推荐。

2021-01-31

大数据电影可视化项目.rar

项目包含python爬虫,Matplotlib、Echarts数据可视化、Mapreduce、hive数据统计、情感分析、词图云、电影票房与评分预测。

2020-09-03

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除