Google云计算的基础架构

帮
助
中
心

网站公告

新闻动态

域名注册

虚拟主机

企业邮箱

数据库

云服务器

备案指南

阿里云应用开发

首页 » 帮助中心 » 云服务器 » 阿里云应用开发

Google云计算的基础架构

发布日期：2016-7-22 10:7:25

　　GFS是 google自己设计的分布式文件系统，是大量安装有Linux操作系统的普通PC构成的集群系统。整个集群系统由一台Master(通常有几台备份)与若干台TrunkServer构成。GFS中文件备份成固定大小的Trunk分别存储在不同的TrunkServer上，每个Trunk有多份拷贝，也存储在不同的TrunkServer之上。Master负责维护GFS中的 Metadata，即文件名及其Trunk信息。客户端先从Master上得到文件的Metadata，根据要读取的数据在文件中的位置与相应的 TrunkServer通信。本文介绍Google云计算的基础架构。

　　据介绍，google的每一份数据至少放在三个不同位置的机器上，因此可靠性是可以高度保证的;而且操作GFS与操作本地磁盘一样简单易行。

　　Google目前拥有超过200个的GFS集群，其中有些集群的计算机数量超过5000台。Google现在拥有数以万计的连接池从GFS集群中获取数据，集群的数据存储规模可达到5个PB，且集群中的数据读写吞吐量可达到每秒40G。

　　MapReduce是一个编程模式，它是同处理/产生海量数据集的实现相关。用户指定一个map函数，通过这个map函数处理key/value(键/值)对，并产生一系列的中间key/value对，并使用reduce函数来合并所有的具有相同key值的中间键值对中的值部分。MapReduce的主要贡献在提供了一个简单强大的接口，通过这个接口，可把大尺度的计算自动的并发和分布执行。

　　常见的应用例子：在很大的文档集合中通机每一个单词出现的次数.map函数检查每一个单词，并对每一个单词增加1到其对应的计数器;reduce函数把特定单词的所有出现的次数进行合并。还有一些其他例子：

　　分布式排序：map函数从每条记录中抽取关键字，并产生(key,record)对。reduce函数原样输出所有的关键字对。

　　BigTable：一种用于管理超大规模结构化数据的分布式存储系统，可管理分布在数以千计服务器上的以PB计的数据。Bigtable API将包括用于创建、编辑表和列，改变群集、表、列元数据的函数。BT不支持完全的关系数据模型，而是为客户提供了简单的数据模型，让客户来动态控制数据的分布和格式。BT只能够支持大部分SQL。

　　URL访问频率统计：map函数处理webpag请求和应答(URL，1)的log。Reduce函数把所有相同的URL的值合并，并且输出一个成对的(URL，总个数)。

　　逆向Web-Link，map函数输出所有包含指向target URL的source网页，用(target,source)这样的结构对输出。Reduce函数局与所有关联相同target URL的source列表，并且输出一个(target,list(source))这样的结构。

　　1、Google App Engine

　　Google App Engine是一个开发、托管网络应用程序的平台，使用Google管理的数据中心。在2008年4月它发布了第一个beta版本。Google App Engine使用了云计算技术,跨越多个服务器与数据中心来虚拟化应用程序。当前，Google App Engine支持的编程语言是Python与Java. http://appengine.google.com

　　2、Hadoop

　　(1)Hadoop(http://hadoop.apache.org)是apache下面的一个分布式并行计算框架，是从lunece中抽取出来的一个框架。Hadoop主要是由HDFS、MapReduce和Hbase组成。

　　(2)HDFS是Google File System(GFS)的开源实现。

　　(3)MapReduce是Google MapReduce的开源实现。

　　(4)HBase是Google BigTable的开源实现

　　Google的上述分布式框架很有创造性，值得阿里云研究与学习，而且有极大的扩展性，使得Google在系统吞吐量上有很大的竞争力，但用C++写的。所以Apache基金会用Java实现了一个开源版本hadoop，支持Fedora、Ubuntu等Linux平台。以上介绍Google云计算的基础架构。

上一条: 云计算究竟是什么

下一条: Erlang对于并行计算和云计算的视点

相关问题		热门问题
Docker在云容器技术领衔 Flocker 0.3.1 新特性 Apache Flume 1.5.2 发布发展中的 Docker 技术 OpenStack私有云DR的益处 Seafile 3.1.11 发布 Docker1.3改动简介 Seafile Client 3.1.10 发... 语音输入四强争霸 Apache Libcloud 0.16.0 ...		Windows Server 2012 防火墙... Linux下l2tp客户端xl2tpd安装配置... 阿里云ECS关于跨服务器快照/镜像的使用说明 Linux系统下测试UDP端口是否正常监听的办... 阿里云ECS通过安全组屏蔽/拦截/阻断特定IP... 如何解决ECS Windows提示显示设置无法... 如何解决ECS服务器误开启了防火墙导致远程连接... 阿里云数据库安全阿里云ECS通过安全组实现将不同账号同地域云服... ECS云服务器的自定义镜像FAQ

新手上路		支付方式	快速通道		服务与支持
域名常见问题	主机常见问题	在线支付	域名信息查询	备案信息查询	帮助中心
邮箱常见问题	云服务器问题	线下汇款	域名控制面板	主机控制面板	网络违法举报
数据库问题	备案问题		万网代备案系统		互联网不良信息举报

业务QQ： 11611616 673768899 673768855		联系电话： 023-61066666 66887777 89082222
离线联系： 13452888882 13452888883 13452888886		备案专线： 023-60887777 备案专员QQ：673768866
联系地址：重庆市九龙坡区石桥铺一城精英国际40层17号 Copyright © 重庆典名科技有限公司 023dns.com All Rights Reserved