- 博客(12)
- 资源 (2)
- 收藏
- 关注
原创 大数据工程师 全攻略!
大数据学习路线java(Java se,javaweb)Linux(shell,高并发架构,lucene,solr)Hadoop(Hadoop,HDFS,Mapreduce,yarn,hive,hbase,sqoop,zookeeper,flume)机器学习(R,mahout)Storm(Storm,kafka,redis)Spark(scala,spark,spark core,spark sql,spark streaming,spark mllib,spark graphx)Python
2021-07-24 19:52:13 174
原创 Centos虚拟机自定义分区
Centos虚拟机自定义分区**磁盘十个分区的区分与作用:**严格限制大小1./根目录分区:保存其他目录的引导信息(/ ext4 2000)2. swap分区:交换分区,物理内存的2倍(空 swap 2000)3. Boot分区:Linux系统启动的相关配置文件,200M左右(/boot ext4 1000)灵活掌握大小的分区4. Tmp分区:存放临时文件(/tmp ext4 2000)5. Opt分区:安装第三方软件(/opt ext4 1000)6. Usr/lo
2021-07-24 19:49:21 695
原创 pickle.dump pickle.load
python的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储;通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象。基本接口:1 pickle.dump(obj, file, [,protocol])**注解:**将对象obj保存到文件file中去。 protocol为序列化使用的协议版本,0:ASCII协议,所序列化的对象使用可打印的ASCII码表示; 1:老式的二进制协议
2021-07-24 19:05:47 227
原创 Linux基本常用操作命令 全!
Linux基本常用操作命令图形化的工具与图形化的操作系统roo t身份的超级管理员localhost 主机名 @在谁谁之上root目录是根目录/的子目录,主机名的目录是根目录/的孙子目录,root的家目录与主机名的家目录是平级的/表示根目录 ~表示当前目录的家目录$普通用户的权限#超级用户的权限ls常用参数 ls -a 所有文件 ls -l 长文件 ll第一列:文件类型: -普通文件 绿色的表示的是可执行文件 黑色的表示的是不可执行的普通文件 红色的
2021-07-23 16:19:55 103 1
原创 准确率(Precision)、召回率(Recall)、F值(F-Measure)-----推荐系统评价指标
下面简单列举几种常用的推荐系统评测指标:1、准确率与召回率(Precision & Recall)准确率和召回率是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。其中精度是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率;召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率。一般来说,Precision就是检索出来的条目(比如:文档、网页等)有多少是准确的,Recall就是所有准确的条目有多少被检索出来了。正确率、召回率和
2021-07-14 20:28:51 274
原创 Embedding漫谈
嵌入层(Embedding)的理解与作用embedding层理解首先,我们有一个one-hot编码的概念。假设,我们中文,一共只有10个字。。。只是假设啊,那么我们用0-9就可以表示完。比如,这十个字就是“我从哪里来,要到何处去”,其分别对应“0-9”,如下:我 从 哪 里 来 要 到 何 处 去0 1 2 3 4 5 6 7 8 9那么,其实我们只用一个列表就能表示所有的对话如:我 从 哪 里 来 要 到 何
2021-07-12 10:53:06 81
原创 一文搞懂 Embedding !
这篇文章把embedding单独提出来,梳理一下embedding在推荐系统中的应用。以下内容主要从深度学习方法和传统的协同过滤方法两个方面加深和理解在推荐系统领域对embedding的认识,详细解读下“embedding”这一重要思想。什么是Embedding?Embedding(嵌入)是拓扑学里面的词,在深度学习领域经常和Manifold(流形)搭配使用。可以用几个例子来说明,比如三维空间的球体是一个二维流形嵌入在三维空间(2D manifold embedded in 3D space)。之所以
2021-07-09 15:24:31 767
原创 《推荐系统之图神经网络研究》
《推荐系统中的图神经网络研究:综述》Graph Neural Networks in Recommender Systems: A Survey1.介绍 本部分主要介绍了推荐系统的基本概念情况,使读者们对推荐系统有一个基本的了解。 一个高效的推荐系统应该准确地捕捉用户的偏好,并推荐用户潜在感兴趣的项目,这样可以提高用户对平台的满意度,提高用户留存率。推荐系统根据用户的兴趣和物品属性来评估用户对物品的偏好。 近年来,图神经网络在关系提取、蛋白质界面预测等许多应用领域都取得了巨大的成功[82]。
2021-03-11 15:35:20 789
原创 推荐算法工程师学习路线及工作指南 全!!
推荐算法工程师学习路线及工作指南 超全!!推荐算法工程师学习路线及工作指南Part 1 作者从零开始学习推荐系统的心路历程Part 2 如何判断自己是否适合从事推荐算法Part 3 推荐系统推荐算法工程师需要的知识储备01 数学基础a.高等数学b 线性代数c 概率统计d 离散数学02 机器学习03 推荐系统04 编程能力05 数据结构与算法06 工程技能07 大数据相关开源技术a 数据收集系统b 数据存储系统c 数据分析系统08 其他支撑技术a 数据库b 操作系统c 网络d 互联网上
2020-11-21 17:50:48 1579
原创 计算机顶会
计算机顶会在机器学习、计算机视觉和人工智能领域,顶级会议才是王者。(1)以下是几个顶级会议的列表(不完整的,但基本覆盖)机器学习顶级会议:NIPS, ICML, UAI, AISTATS; (期刊:JMLR, ML, Trends in ML, IEEE T-NN)计算机视觉和图像识别:ICCV, CVPR, ECCV; (期刊:IEEE T-PAMI, IJCV, IEEE T-IP)人工智能:IJCAI, AAAI; (期刊AI)另外相关的还有SIGRAPH, KDD, ACL, SIG
2020-11-09 16:18:39 4000
原创 Pandas 你想要的API,这里都有~
Pandas官方文档Pandas 中文API文档缩写和包导入导入数据导出数据创建测试对象查看、检查数据数据选取数据清理数据处理:Filter、Sort和GroupBy数据合并数据统计缩写和包导入在这个速查手册中,我们使用如下缩写:df:任意的Pandas DataFrame对象s:任意的Pandas Series对象同时我们需要做如下的引入:import pandas as pdimport numpy as np导入数据pd.read_csv(filename):从CSV文件导入
2020-11-08 21:22:17 121
原创 Python 他来了,他来了!
Python教程pytuon教程这是小白的Python新手教程,具有如下特点:中文,免费,零起点,完整示例,基于最新的Python 3版本。Python是一种计算机程序设计语言。你可能已经听说过很多种流行的编程语言,比如非常难学的C语言,非常流行的Java语言,适合初学者的Basic语言,适合网页编程的JavaScript语言等等。那Python是一种什么语言?首先,我们普及一下编程语言的基础知识。用任何编程语言来开发程序,都是为了让计算机干活,比如下载一个MP3,编写一个文档等等,而计算机干活
2020-11-04 09:16:27 546
servlet实现学生信息管理系统源码
2020-11-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人