• 1
  • 2
  • 3
  • 4
  • 5
百家谈云计算 首 页  »  帮助中心  »  云服务器  »  百家谈云计算
原腾讯云架构师谈可扩展系统的入门基础
发布日期:2016-3-3 17:3:23

  肖立鹏原来在腾讯云(如阿里云)做架构师,目前在Udesk担任CTO职位。下面是他分享的Udesk在可扩展高并发架构方面的一些实践经验。

  随着智能设备的普及使得高并发场景越来越多,可扩展成为系统设计的必要条件,下面分别介绍下可扩展系统的四个重要组成部分

  一、负载均衡——冗余容错&可扩展性

  水平扩展:负载能力和增加硬件呈线性关系。若你有一台服务器并增加一台,负载能力翻倍,再增加一台,负载能力增长33%。

  冗余容错:一台服务器死机不会影响服务的正确性,只是降低系统的负载能力。

  一般的冗余和水平扩展等,都可以通过负载均衡来实现。主要有3种实现方法:

  1、软件负载均衡:通过路由分发,心跳探测等方法,实现软件层面的负载均衡,典型的开源组件有:LVS,Nginx和HAProxy等。目前大多数互联网公司均采用软件负载均衡。

  2、客户端负载均衡:这里的客户端是广义的客户端,例如服务a调用服务b,我们认为服务a是客户端。客户端配置n个服务端的地址,采取 Round-Robin或者其他随机策略访问服务端。优点是编码实现简单;缺点是变更困难,服务端迁移需要升级所有客户端配置,当然你可以搭建配置服务,这个服务本身也是单点,然后为配置服务实现负载均衡……

  3、硬件负载均衡:购买专用的负载均衡器,例如Citrix NetScaler。优点:性能卓越; 缺点:昂贵,高富帅专用。

  二、数据缓存

  缓存是一个系统中性能提升的关键。主要有5种实现方法:

  应用层:应用自己在本地内存或其他介质中缓存部分数据,一般通过LRU算法淘汰。

  CDN:对于静态文件,一般采用CDN来加速。

  内存缓存:目前的主流解决方案,代表有MemCached和Redis,Redis的优点是数据结构 丰富,可以轻松支持排名等场景,缺点是单进程实现导致持久化方案不够完美,今年4月Redis Cluster终于迎来了第一个稳定版本,可以实现数据自动sharding和容错,稳定性有待后续检验。

  数据库层:数据库引擎自身的缓存,需要DBA来配置优化,当然现在也有不少NoSQL的缓存+存储解决方案如MongoDB、带HandlerSocket插件MySQL、ttserver等。数据库缓存的好处是应用侧代码不需要更改。

  网页缓存:在Apache等HTTP服务器上,配置full-page cache等策略。

  使用缓存的过程中,必须要注意缓存有效性,在数据源更新后,要及时更新缓存中的数据。目前主要有read-through和write-through两种策略,采用write-through的多些。

  三、离线处理

  对搜索引擎,广告推荐等数据分析类场景,必须对数据做离线处理。主要有3种主流的实现方法:

  1、消息队列:任务排队,并发处理等,主流开源组件有RabbitMQ,Kafka。

  2、定期任务:每天每小时的任务,使用crontab或者其他cron服务来调度。

  3、并行计算:采用MapReduce,其它主流开源组件有Hive,Impala等。

  四、平台建设

  提供给应用的,不是一堆组件,而是一组API,把底层架构隐藏起来。这样有两个主要的好处:

  底层架构重用,可支撑多应用,运营更方便。

  应用和底层架构解耦合,底层架构可自我演进,是Scale的必备基础。

  原文链接:http://segmentfault.com/a/1190000002785846