阿里副总裁章文嵩:淘宝基础设施构建实践 |
发布时间: 2012/9/4 16:36:43 |
6月29日,第七届“开源中国 开源世界”高峰论坛上,阿里副总裁章文嵩发表《淘宝基础设施构建实践》主题演讲,他表示淘宝是开源系统的受益者,并积极参与开源生态系统的建设,促进开源生态系统的发展,积累更好的口碑,凝聚人才,迎接未来更大的技术挑战。淘宝公司希望以更开放的方式与世界一起进行技术创新。
我叫章文嵩,我在阿里集团做基础平台,今天跟大家分享一下我们在底层基础平台建设方面的一些经验。分几个议题,首先介绍一下淘宝网,然后介绍一下目前软件基础设施的情况,通过事例看看我们是怎么走过来的,有三个典型事例,从图片储存到CDN再到数据库,然后分享一下淘宝的开源策略。 网购代名词——淘宝网 淘宝网简介,可能很多人都知道淘宝网是一个网络购物的代名词,有市场报告显示,去年淘宝网交易额是7800多亿,淘宝网占7层份额,淘宝网上面大概有七八百万卖家创造了直接的就业机会,职业就业机会270多万个,淘宝网的网络流量,目前基本上在13名左右,第一名谷歌,第二名FACEBOOK,这个排名会条约,比如我们做大促时候,有可能冲到11名,过年时候网络购物少的时候可能降到18名,国内是第3名。 支撑网站排名背后的流量一天现在大概700多万个访客,我们跟踪帐户登陆,有700多万个,去年双12大促一天有1.25亿人访问,那时候CDN访问流量856G,整个淘宝网页一天25亿,淘宝网站上有800多个应用。针对这样的规模搭建基础设施也并不容易,我们的基础设施每年在不断的发展,可能以百分之七八十速度在增长。 淘宝基础设施 淘宝的基础设施,最上面是CND系统,我们在全国布很多点,让用户访问家门口的机器,中间是交易平台,背后是基础设施软件,存储系统,我们有数据库,包括海量数据处理平台和资源调度平台,左侧有淘宝的搜索,淘宝上有十几亿商品,用户进来要搜索,我们要做到实时搜索,比如用户变更了价格,在搜索引擎里几秒钟要反映出来,卖家变更一些信息之后往往自己上去查,如果查不到自己就会投诉。右侧是广告系统,是收入的主要来源,还有数据挖掘平台。 我们有一个内核的团队,几万台服务器支撑淘宝网,我们根据应用的特点做优化,过去Apache用的比较多,我们还有数据库团队,这是目前在单机上做的事情。上面是分布式系统,多机环境,有分布式存储,像TFS、分布式表格系统,还有图像搜索团队,图像搜索输入一张照片,我们有CDN分发系统,还有海量数据的计算,包括旺旺平台,现在将近一千万同事在线,虚拟化管理,负载均衡,包括网络的解决方案。 本文出自:亿恩科技【www.enkj.com】 |