阿里数据库大神褚霸:从技术创业到阿里云数据库团队
4月19-21日的2016云栖大会深圳峰会,有前沿技术深度分享、Workshop阿里云开放实验室、行业企业聚会、Tech Insight实战干货,更有20+场分论坛,120+高浓度实战演讲,100+阿里核心技术专家。为了让大家更为深入地了解云栖大会深圳峰会的日程设置,云栖社区对20+位分论坛出品人进行了系列采访。
本期采访嘉宾——阿里数据库大神褚霸。
余锋,花名褚霸。他身上的标签很多,比如阿里数据库领域技术带头人、专注代码19年、踏实靠谱务实热心的牛人工程师、Erlang社区大神,甚至江湖中还流传着“拜霸神教”的传说。这些标签和故事,可以从ATA的采访,以及知乎多位友人爆料中看到。而刚成为阿里五年陈的褚霸将率数据库技术团队在云栖大会深圳峰会上亮相。他告诉云栖社区:将有大招要放!
阿里云研究员 褚霸
从技术创业到阿里云数据库团队
大招是什么?很多猜测。
不妨先从褚霸的发展来看。1997年毕业之后,在几家大公司呆过之后,一直喜欢“各种折腾”褚霸创业了三次:做软硬件结合的报警器,开发类似网银的互联网金融系统,类似于P2P做PPStream的看视频的产品。每次都是产品很牛,但因为资金支持、市场投放等因素都没成功。所以他对自己的总结是:“这不是我擅长的,我的定位点是是踏实做技术。”
2010年,看到正明(章文嵩)这么一个社区大牛来到了阿里,他也随之而来。来到RDS团队后,带领着10余人的团队,真正把技术钻研透彻,解决了当时许多棘手的问题。渐渐的技术氛围好了,业务也好了,瓶颈也被打开了,口碑自然就起来了。很多同学转岗过来,大量牛人进来,人才的聚集使得技术推动业务,业务反馈技术优化的正循环开始形成。业务的井喷进自然会推动团队将技术研究到精细化,做的更好,能力在实战中得到锻炼,技术人员自然会高速成长。团队不知不觉扩到了40多人,后来更是接近了100人。现在,产品和服务还在不断增加中,现在提供了包含MySQL,SQLServer,PostgreSQL,PPAS,MongoDB,Memcache,Redis,PB级数据库存储分布式数据库,数据传输,数据管理等在内的众多云数据库服务。
实际上,社区TOP 10数据库里面有6种阿里云已经在支持或者兼容了。“我常想,数据库最核心的竞争力就是它是数据库引擎,相当于汽车的发动机。所以我们和竞品做评测比试,性能、稳定性等,都是其他家的1-2倍。用户真么评价我们,数据库性能如丝般柔顺。与此同时,数据库引擎近些年会有颠覆性引擎,比如Tokutek的TokuDB(MySQL开源存储引擎),比如图数据库,所以我们还要紧跟这些技术变化,跟着大社区趋势来走。当然,还有利用集团的力量,OB(OceanBase)中的突破技术更好地应用在我们数据库中,来提升整体竞争力。”
褚霸曾对ATA记者说:“因为不擅长管理,所以我会花更多时间来引导大家如何来学习,怎么去有追求,怎么去开阔技术视野,给他们更多空间,放权给他们,这样他们自己也是自信满满的,能够按自己的爱好、兴趣、专长,去做自己专长的事情。那我只需要在关键节点上去看住,保证团队往前跑的不摔,然后陪着大家,这样我觉得会顺点。”他是如此说,也是如此做的。最初几年,常常半夜和同学们一起发布系统,他相信陪伴也是一种力量。
有很多同学都看过褚霸的技术博客。但对于博客分享,他有切身感触。“其实我是最恨记笔记的那种人,上学的时候从来不记笔记。但后来我钻研很多技术,2-3年后有人问我,我再去想的时候只能记得这件事情做过,但细节已经完全想不起来。而以前认识一个小伙子,喜欢写博客,基本就是当成笔记来做的。以后再遇到问题,让别人翻翻博客就好。我觉得这样方法很好,在我们研究过程中,有很多收获,很多耐不住开心想要分享的。所以我也学习他,最初写的很烂,只有2-3行,也有是炫耀性的。而后来,我花几个小时或者几天解决的问题,也帮助了无数遇到这些问题的朋友,让大家都少花一些时间。积累400-500篇后,影响很大,比如学Erlang的人几乎没人没看过我的博客。你可能做小小的一个事情,但是可以帮到很多人,那这种带来的不单单是技术上的,有很满足的感觉,从07年坚持到现在的一种习惯。”
阿里数据库一直积极拥抱社区并与社区互动,比如是好几个分支的committer,WebScaleSQL也是核心成员,一直都是第一队列。甚至还有几位同学会不断追踪社区变化。以后,褚霸对云栖社区说:“还可以做更多。”
豪华阵容亮相云栖大会深圳峰会
做更多?先剧透,具体留给大会现场。
在褚霸看来:数据时代的到来使得用户对数据库的需求非常复杂。一方面,数仓、计算、分析、搜索等需求,需求在自然延伸;另一方面,数据积累越来越多,历史归档需求希望获得低成本技术服务。“这些都是我们后续要重点满足的。事实上,我们在新产品方面已经非常克制。比如GreenPlum是为了搭建数据仓库计算环境,Petadata(阿里自研)是为了解决PB级别数据底层存储的问题,而MongoDB从3年前开始关注,到现在正式面向用户,时间是很长的。2015年的公测产品较多,但今年会将节奏收回来,走向更深应用层面。比如安全合规方面做更多,6月份安全特性会全面超越竞品。”
这意味着,今年会主做“硬骨头”项目,让产品和服务体现更大的价值。
背后必然是团队人才的阶梯性变化。谈到人才招聘和培养,他的观点非常鲜明:不在于数量,而在于质量。“够不够屌?一人扛起产品的半壁江山”。现在团队进来的都是高P。有位Oracle专家收到很多offer,但当听说阿里云数据库在某个他感兴趣的技术领域会深挖,他立即表示如果收入只有一半也愿意过来。所以这些人才不完全是看待遇的,而是看技术方向。这个例子也说明了阿里云数据库团队的人才布局:更好的人才做核心的事情,流水线的事情会逐步交给生态伙伴来做。
如何建立数据库的生态?起点就是云栖大会深圳峰会的数据库分论坛。这是论坛的议程:
4月19-21日,2016云栖大会深圳峰会,欢迎报名!
涵盖技术趋势、DBA转型、源码维护和运维、优化和故障排查等技术人最为关注的热点。更多干货将由阿里云数据库团队骨干现场分享。当然,如果想与阿里云数据库专家们有更多交流,欢迎来云栖社区数据库公众号,他们都在这里。