云计算时代驾到
发布日期:2016-7-26 14:7:15
加利福尼亚州圣克拉拉市举行的2010年Cloud Connect大会,是今年最早举行的云计算重大会议之一。目前为止,会议一个较大的议题是“不使用关系型数据库来保持数据的持久性”。这个议题被称为 “NoSQL”运动,它的宗旨是使用其他形式的数据库,能够更有效地处理大规模的数据。而关于围绕云计算出现的“大规模数据”,我已写过一些文章,但这一运动更为重要,它将推动数据回归到以更简单、但是却可能更有效的模型进行物理存储的方式。 NoSQL系统在运行时一般会把数据存放在内存中,或是并行地从许多磁盘上读取数据。其中就有一个问题,“传统”的关系数据库不提供这种模式,所以也没法提供同样的性能。在过去那种数据库中,若只有几个GB数据,这一问题还不是很明显,但许多云计算的数据库已经超过了1TB,还会有更多的大规模数据库会被用来支撑不断发展的云计算系统。在关系型数据库上对大规模数据进行操作是兵家大忌,由于在处理数据时SQL请求会占用大量的CPU周期,并会导致大量的磁盘读写。 若你觉得以前好像在哪里听过这种说法,那我告诉你其实你是对的。早在上世纪90年代,对象数据库于XML数据库就取得过一些进展,虽然那时许多非关系型数据库确实能提供更好的性能,但是很多企业却守住了关系型数据库的江山,如Oracle、Sybase与Informix。然而,因为从关系型数据库上迁移出去的花费和风险太高,且数据的规模也相对较小,使得关系型数据库几乎一统天下。 但,云计算改变了一切,发展好的云计算公司如阿里云、IBM等都引到云计算的潮流。在云计算中需要对大量的数据进行处理,这一需求导致新的数据库处理方法运用在了旧模型上。MapReduce是Hadoop处理数据的基本方法,它是基于几年前的“无共享” (share-nothing)数据库处理模型,但是现在我们有了实现它的处理能力、磁盘空间以及带宽。 我估计云计算的发展将会减少对关系型数据库的使用。这并非新鲜事物,但是这回我们却实实在在需要改变了。 上一条: 云计算是如何兴起的 下一条: 云计算浪潮中的那些重要角色
|