大数据处理心得

最新推荐文章于 2024-09-14 19:55:29 发布

weixin_30609331

最新推荐文章于 2024-09-14 19:55:29 发布

阅读量194

点赞数

文章标签：数据库 java 大数据

原文链接：http://www.cnblogs.com/mihu/archive/2013/06/13/3134664.html

版权

1.建表：

分析数据量的大小：每天的增量超过1000万，果断建成按时间每天分区的分区表；

每月的增量超过1000万，果断建成按时间每月分区的分区表；

分析需求，根据哪些数据是经常需要查询的，建立索引，分区表一般建立本地索引比较好维护；

根据哪些数据是需要组合查询的，可以建立组合索引。

2.数据入库：如果数据需要复杂的处理和过滤，可以用java或者shell脚本将数据预先处理好；

　　　　　然后通过sqlldr／java的批量插入／存储过程将数据入库。

3.数据统计：对于查询大数据量会很慢，就写一些定时脚本事先统计好那些固定要查的数据插入另外一个表中。

4.sql语句的优化：写好统计语句时查看sql的执行计划；

sql的条件里尽量用到建立索引的字段；

写sql时的条件参数不要拼接，那样数据库会硬解析，增加数据库的负担；

转载于:https://www.cnblogs.com/mihu/archive/2013/06/13/3134664.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30609331

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

大数据基础知识总结和大数据方面的核心技术

congcangnuo6739的博客

12-26

2448

一、什么是大数据 一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库 软件工具能力范围的数据集合，具有海量的数据规模、快速的数据流...

大数据学习心得

热门推荐

知行_那片天

03-01

5万+

大数据学习心得一、概述1大数据简介 1.1起源 “大数据“，近几年来最火的词之一。虽然大数据这个词的正式产生也就10年左右，但对大数据分析却早就有之。早在互联网初期，就有很多公司通过计算机技术对大量的分析处理，比如各个浏览引擎。然而，大数据的真正提出却是源自2008.09.03 《Nature》专刊的一篇论文，紧接着，产业界也不断跟进，麦肯锡于2011.06 发布麦肯锡全球研究院报告，标志着

参与评论您还未登录，请先登录后发表或查看评论

大数据处理技术心得体会

fzy927的博客

12-28

1141

标题大数据处理技术心得体会 刚开开始搭建什么jdk、Hadoop、Scala环境的时候我感觉的时候我感觉做一步就卡一步，很奇怪，为什么会遇到这么多问题，然后就直接下了老师的spak教学系统，直接免安装前面的环境配置，然后回头做前两章的时候又没有遇到什么问题，遇到的问题也挺顺利的解决了，难道这就是熟能生巧？遇到问题越多就懂得更多？有点像被动学习。还有一部分命令执行了也还是不知道什么意思，不会套用，就像木头一样按部就班，看到稍微不一样就不会用了。比如在IDEA创建Maven的时候就是木讷的安装课本图片操作

数据处理心得

weixin_46612732的博客

09-26

1415

# for i in range(123): # iris = pd.read_excel('C:\\Users\\st\Desktop\\%s.xlsx'%(i),'进项发票信息') # # 第三步：获取class列表并去重 # class_list = list(iris['企业代号'].drop_duplicates()) # #第四步：按照类别分文件存放数据 # for i in class_list: # iris1 = iris[iris['企业代号']==i] # i

大数据系统处理技术总结

wzx19840423的专栏

12-15

434

大数据清洗和预处理期末总结

weixin_64272885的博客

12-20

649

大数据清洗和预处理期末总结

大数据学习心得与总结

qq_38590020的博客

05-22

1万+

大数据学习心得与总结在此之前，需要做的准备： 1、vnware创建centos虚拟机 2、安装secureCRT 3、安装eclipse 4、配置JDK 作业一：centos搭建伪分布式修改虚拟机配置文件 ①core-site.xml <property> <name>fs.defaultFS</name> <val...

python数据分析心得体会_Python数据处理总结

weixin_39727743的博客

11-25

2476

Python可以很好地完成预处理任务，本文对python常用的numpy & pandas做一些总结。1. 文本读写python本身就带有open()函数，配合readline()/write()函数可以完成读写功能。但注意pandas也有很强大的读写能力，包括函数read_csv()to_csv()read_excel()to_excel()。这里提一点：read_csv()函数可以指定inde...

大数据期末课设~基于spark的气象数据处理与分析

12-14

总结，这个项目不仅涵盖了Spark的大数据处理技术，包括数据获取、数据清洗、数据分析和数据可视化，同时也体现了大数据在气象领域的应用价值。通过这样的实践，学生能够掌握大数据处理流程，并了解如何利用大数据...

实验设计与数据处理心得.doc

12-17

实验设计与数据处理心得.doc

关于物探数据处理与解译的几点认识——“老矿山物探技术研讨班”学习心得.pdf

08-15

《关于物探数据处理与解译的几点认识》是一篇探讨地球物理勘探（物探）技术的文章，作者通过参与“老矿山物探技术研讨班”并聆听多位专家的讲座，总结了物探数据处理和解译的关键问题。物探数据处理是矿产勘查中的...

大数据处理学期总结

f54268589的博客

06-15

749

大数据处理学期总结

大数据处理技术 - 基于Hadoop的实战

中科院计算所培训中心

08-20

921

随着互联网、移动互联网和物联网的发展，我们已经切实地迎来了一个大数据的时代。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合，对大数据的分析已经成为一个非常重要且紧迫的需求。目前对大数据的分析工具，首选的是Hadoop平台。Hadoop在可伸缩性、健壮性、计算性能和成本上具有无可替代的优势，事实上已成为当前互联网企业主流的大数据分析平台。为解决广大系统设计人员深入研究

学习心得——数据预处理（探索性数据分析）

q838458640的博客

09-15

2560

典型例子，性别、种族、职业等。离散数据中，分。

大数据分析处理实践的一点心得

bitcarmanlee的博客

03-02

1万+

最近的项目中，需要对海量的原始数据进行加工处理。并且数据的来源也不尽相同，数据处理链条很长。针对这种实际应用中的场景，有几点小小的新的体会，特意总结一下。1.最重要的是，编码之前尽可能多地搞清楚原始数据各字段的含义。越是原始数据复杂，越是数据多，越是数据大，越是需要从业务角度理解数据的含义。否则可能因为一个小小的细节，会让你痛不欲生，白白浪费好多时间，而且debug过程的痛苦，你懂的。 2.编码前

大数据处理技术的总结与分析

大数据工程师

05-26

1万+

在我们实际生活中，事务型数据处理需求非常常见，例如：淘宝网站交易系统、12306网站火车票交易系统、超市POS系统等都属于事务型数据处理系统。一数据分析处理需求分类 1 事务型处理在我们实际生活中，事务型数据处理需求非常常见，例如：淘宝网站交易系统、12306网站火车票交易系统、超市POS系统等都属于事务型数据处理系统。这类系统数据处理特点包括以下几点：一是事务处理型操作都是细...

数据分析心得体会-20190131

Jameskittttt的博客

01-31

4578

数据分析心得体会 在进行数据分析工作时，如何把握大方向和细节在结论中的占比程度。首先得找准需求的亮点！需要考虑提出需求的点在哪里！讨论一下需求的要点和核心点。如果方向较为混乱，则采用多角度的结论，而后选择其中的一些结论。当遇到多种类数据分析时，可采用局部分析法，两两筛除。切记在数据进行对比分析时，保持其唯一性，以及维度一致此次数据分析量较大，总计约1...

4.网络编程