科研
文章平均质量分 83
AlanLee234
这个作者很懒,什么都没留下…
展开
-
4 万字全面掌握数据库、数据仓库、数据集市、数据湖、数据中台
4 万字全面掌握数据库、数据仓库、数据集市、数据湖、数据中台本文对这些名词术语及内涵进行系统的解析,便于读者对数据平台相关的概念有全面的认识。(给程序员的那些事加星标)来源:修鹏李如今,随着诸如互联网以及物联网等技术的不断发展,越来越多的数据被生产出来-据统计,每天大约有超过2.5亿亿字节的各种各样数据产生。这些数据需要被存储起来并且能够被方便的分析和利用。随着大数据技术的不断更新和迭代,数据管理工具得到了飞速的发展,相关概念如雨后春笋一般应运而生,如从最初决策支持系统(DSS)到商业智能原创 2021-01-26 16:32:02 · 676 阅读 · 1 评论 -
NLP技术目录
NLP技术目录01 目录第一部分:机器学习基础篇第一章:自然语言处理概述自然语言处理的现状与前景自然语言处理应用自然语言处理经典任务第二章:数据结构与算法基础时间复杂度、空间复杂度动态规划贪心算法各种排序算法第三章:分类与逻辑回归逻辑回归最大似然估计优化与梯度下降法随机梯度下降法第四章:模型泛化与调参理解过拟合、防止过拟合L1与L2正则交叉验证正则与MAP估计第二部分:文本处理篇第五章:原创 2021-04-08 15:42:02 · 32 阅读 · 0 评论 -
PCA+ICA+SVD+FA
方差方差的大小描述一个变量的信息量,对于模型来说方差越小越稳定,但是对于数据来说,我们自然是希望数据的方差大,方差越大表示数据越丰富,维度越多协方差协方差描述两个变量的相关程度,同向变化时协方差为正,反向变化时协方差为负,而相关系数也是描述两个变量的相关程度,只是相关系数对结果相当于做了归一化处理,协方差的值范围是负无穷到正无穷,而相关系数值范围是在负一到正一之间数据降维作用1、减少存储空间2、低维数据减少模型训练用时3、一些算法在高维表现不佳,降维提高算法可用性4、删除冗余数据5、有助于原创 2021-01-25 12:05:37 · 45 阅读 · 0 评论 -
领域术语解释
数据科学(Data Science)InfoBox:中文名:数据科学外文名:Data Science学科:跨学科研究领域实质:数据全生命周期的相关技术和方法基本简介:数据科学通过融合多学科交叉技术(包含统计学、数据分析、机器学习等)实现从数据中发现有价值的信息或规律。数据科学不同于计算机科学和信息科学,数据科学是一个跨学科领域,利用来自数学、统计学、计算机科学、信息科学等许多领域的技术和理论,在结构化和非结构化数据中探索数据潜在的模式[1][2],从中提取知识和分...原创 2021-09-23 18:52:06 · 406 阅读 · 0 评论 -
周志华教授:如何做研究与写论文?
本文整理了著名人工智能学者周志华教授《做研究与写论文》的PPT(时间比较早,但方法永远不会过时)。其详细介绍了关于为什么要做研究?如何做研究,选择研究方向、选择研究课题(Topic),学习领域知识、选期刊投稿、稿件处理过程、写高水平论文的方法与技巧等方面的知识,是一份非常优秀的做研究和写论文指南,值得每个人细读!周志华个人简介他于2001年1月留校任教,2002年破格晋升副教授,2003年获国家杰出青年科学基金,随后被聘任为教授,2004年获博士生导师资格,2006年入选教育部长江学者特聘教.原创 2021-08-16 12:16:16 · 53 阅读 · 0 评论 -
清华刘洋:论文写作,信息为表,逻辑为骨,思想为心
报告:刘 洋导读在2021年6月2日下午举办的青源学术年会论坛上,清华大学计算机系教授、智能产业研究院副院长刘洋老师就如何撰写高质量科技论文,提出了“信息为表,逻辑为骨,思想为心”的方法论。注:本文为「2021北京智源大会」报告,回放视频请关注:https://2021.baai.ac.cn/schedule01简介 首先“信息为表”是指信息传递,即从读者角度看到的是论文本身;“逻辑为骨”是指信息的传递需要按照逻辑来进行组织;“思想为心”是指在论文中最...原创 2021-08-16 12:06:11 · 46 阅读 · 0 评论