数据挖掘
文章平均质量分 73
张小凡vip
2012年中级职称软件设计师;
2017年高级职称项目管理师;
2018年CSM敏捷认证;
2019年csdn20周年直播嘉宾;
2020年高级健康管理师;
清华大学出版社《MongoDB游记》数据库教程书作者。
专注于数据挖掘技术与大数据,云计算与存储等技术的学习与研究。
擅长系统响应式开发、数据采集数据清洗和数据分析,分布式云存储运算等技术。
熟悉数据的采集、数据的清洗(ETL)、存储(Data Storage)、挖掘(Data Mining)整个流程。
熟悉后台系统、云存储计算平台的搭建,擅长解决架构过程中遇到的疑难问题。
常用开发语言:java、python、c#、perl、sql。
展开
-
数据分析和数据挖掘的区别在哪
目标:数据分析侧重于解释数据,数据挖掘侧重于发现模式。方法:数据分析主要使用统计和可视化技术,数据挖掘使用算法和模型。应用场景:数据分析侧重于业务报告和运营优化,数据挖掘侧重于发现新知识和新模式。数据规模:数据分析处理中小规模数据,数据挖掘处理大规模数据。结果的可解释性:数据分析的结果通常更易于解释。虽然它们有所区别,但在实际应用中,数据分析和数据挖掘常常结合使用,以提供全面的洞察和解决方案。原创 2024-11-11 00:57:49 · 988 阅读 · 0 评论 -
数据挖掘(七) -----在python程序中使用hail
我们在之前的文章中已经尝试安装了hail和简单的使用数据挖掘(五) -----基于Spark的可伸缩基因数据分析平台开源存储运算架构hail全面了解和安装但是 我们发现 这种hail的运行方式 是需要进入到conda的hail的虚拟环境中才能运行的。我们业务一般来说 都是在外层执行,还有其他的业务逻辑,所以最好还是在python的py程序中就能调用hail,而不是进入到conda的虚拟环境中...原创 2020-02-22 13:19:52 · 2024 阅读 · 0 评论 -
数据挖掘(五) -----基于Spark的可伸缩基因数据分析平台开源存储运算架构hail全面了解和安装
hail简介hail是一个开源的、通用的、面向python数据类型的处理基因数据专用的分析库和方法解决方案。hail的存在是 为了 支持 多维度的复杂的数据结构,比如 全基因组关联数据研究(GWAS).GWAS Tutorialhail的底层是通过python,scala,java和apache spark来实现的。hail官网官方文档hail的官方论坛维护hail的团队是 Nea...原创 2020-02-21 18:32:29 · 1992 阅读 · 0 评论 -
数据挖掘----基础--conda安装---miniconda
conda简介Conda 是一个开源的软件包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖关系,并在它们之间轻松切换。 Conda 是为 Python 程序创建的,适用于 Linux,OS X 和Windows,也可以打包和分发其他软件。安装condaconda分为anaconda和miniconda。anaconda是包含一些常用包的版本(这里的常用不代表你常用 微笑.jpg),...转载 2020-02-14 17:19:26 · 1478 阅读 · 0 评论
分享