《大数据挖掘、分析与应用》前四讲个人总结
一、第一讲环境部署
1.大数据的定义
大数据指无法在可承受的时间范围内用常规软件工具进行捕捉管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
2.数据挖掘的定义
数据挖掘是有组织有目的地收集数据,通过分析数据使之成为信息,从而在大量数据中寻找潜在规律以形成规则或知识的技术。
3.数据分析
适当方法对大量数据分析,提取有用信息形成结论对数据加以研究和概括总结的过程。总结的过程。这-过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。
4.python语言特征
面向对象的解释型计算机程序设计语言,python有丰富和强大的库、动态语言、强数据类型。****
二、第二讲基本知识
1.变量
命名规则:
标识符只能由字母数字和下划线组成。
标识符的第一个字符不能是数字
标识符区分大小写
关键字不能声明为标识符
2.语句
python语句的特征ÿ