mysql 结构化数据库_mysql – 哪种数据库技术适用于大型结构化数据?

场景:认为你在200个表中有90TB的文本.这是结构化的相关数据.比较dbpedia只有更多的数据.任何真正的关系,分布式和高性能的数据库都可以完成这项工作.不要期望与社交网络一样多的更新,但是大约500个读取/ s 20updates / s但是除了那些之外需要的主要功能是高速运行对数据库的大分析,因为数据应该通过apache mahout等机器学习进行重新设计和改进不断.

现在第一个问题是,哪些数据库技术开始(或等待它们被重新启动)首先使用相对较少的网络访问者维护所有数据,但对分析/机器学习的快速运行需求很高?第二,为了特殊的特殊目的而跟踪哪些其他数据库,这些数据库可能会发生,哪些特定目的可能会从列表中删除,或者成对出现只应该应用一个(/更好)的数据库.

Cloudera/Brisk (Cassandra,Hive)

mysql(cluster), mariadb

Berkeley DB

drizzle, nimbusdb,

scidb (http://www.theregister.co.uk/2010/09/13/michael_stonebraker_interview/)

mongodb

datadraw

neo4j

解决方法:

But main feature required besides those is running big analyses on the database in maximum speed

所以你现在所需要的只是90TB的内存而且你已经设置好了. “最大”速度是一个非常相对的概念.

I have got about 90TB of text in a ~200 tables. This is structured related data. Any true relational distributed and per formant database would do the job.

什么是“真正的关系分布式数据库”?

让我们翻看一下.假设你有90台服务器,每台服务器都有1TB的数据.您计划在200个表和90个服务器之间执行连接的计划是什么?

通常,跨服务器连接,不能很好地扩展.尝试在90台服务器上运行连接可能会扩展得更少.分区200个表是很多工作.

which other databases to keep track of generally in this context and which to drop off the list

好的,所以这里有很多后续问题:

>你现在在跑什么?

>你的痛点是什么?

>你真的打算放入新系统吗?

>是否有一个较小的子系统可以先测试?

>如果您有200个表,那么您运行了多少个不同的查询?成千上万的?

>您打算如何测试查询是否正常运行?

标签:mysql,cloud,mongodb,cassandra,bigtable

来源: https://codeday.me/bug/20190626/1296356.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值