深圳云栖大会数据库技术专场8大爆点
4月21日下午在深圳大中华喜来登召开的云栖大会-Tech Insight-数据库技术专场在开始前半小时,全部位置已坐满以至于在正式开始前就地上坐满了人,过道站满了人,不得不派出安保维持现场秩序。
是什么让技术人员如此热情高涨?没错,就是数据库技术网(干)红(货)见面会。开会前,某技术网红(此处特指褚霸)说要放大招。今天,我可以告诉你,大招是PB级数据存储:PetaData数据库发布、SAP HANA One数据库的合作和云数据库OceanBase发布。当然,还有更大招,将在7月云栖大会北京峰会对外公开,现在就可以期待了。
前方高能大招,各位准备好了吗?请擦亮眼睛观看本场内容的8大观点:
一、褚霸:我们正在见证数据库的变迁
数据库从上个世纪70年代开始,经过50年的发展,当前已有300多种数据库系统。
1)数据库焦点在转移:近看这10年的发展,为了更好的支撑互联网应用构建和迭代,架构师们更愿意选择轻量级数据库,特别是MySQL,所以我们看到数据库的焦点正在从商业库向开源数据库倾斜。
2)处理能力在发展:而从技术角度来看,一方面是从单机数据库向分布式快速发展,另一方面数据库正在从单一的事务处理或者计算处理,向混合型处理发展,我们称之为HTAP(Hybrid Transaction/Analytical Processing) 。
3)使用模式在转变:从数据库获得途径来看,正在从传统软件+硬件走向云平台(服务)的新模式。
二、何导:DT时代,“数据”是必须重视的核心资产
企业经营多年,最后积累的永久宝贵资产除了钱就是数据。
根据不完全统计调查显示,当前创业公司中拥有数据库管理员(DBA)的企业小于4%(专业的DBA人才都集中在几个大型企业中),而这4%中还有一半以上是由运维人员兼职的。这在提醒我们:企业的最宝贵资产 —“数据”没有人保管!?
ApsaraDB 团队致力于将数据库门槛降到0点,一键为用户创建一套完整而专业的数据库解决方案,包括高可用、高密度监控、备份和恢复、自动优化等。让开发可以轻松、专业的管理数据库。
而面向日夜忙碌的DBA,我们不但可以帮助他们减少60%的日常工作,而且可以让他们以“数据管理员DataA”的视角,以“企业数据”为中心,全方向重新审视安全性、可靠性、可扩展性、远距离容灾等数据盲点,以全新的职能全力协助企业快速发展。
三、丁奇:数据库宕了,到底是谁的原因?
数据库宕了大家着急,但很难使上力。于是各种猜测、指责开始蔓延…究其原因就是无法判断问题出在哪里,如何快速恢复。而今天,ApsaraDB 一直致力于建设高可诊断性的数据库。通过全链路监控,能够快速判断链路问题出在哪个节点。
通过保存所有审计日志,在用户事后发现时, 授权后能够分析导致所有异常的原因。审计日志中可以保存每个语句的原文、来源ip、端口、微秒级执行时间、微秒级开始时间、扫描行数、返回行数、执行结果等,典型应用场景如:
1)当用户发现数据被删除时,可以查出执行删除语句的所有信息方便定位;
2)当用户出现大量锁等待时,可以分析出问题当时所有线程的事务状态,从中分析锁等待关系链;
3)当用户出现大量读io时,可以分析当时所有语句的扫描行数轻松判断;
从链路、主机、实例级别保存所有信息,使得数据库实例随时处于可诊断状态。
四、丁奇:比社区版本快100倍。真的吗?
ApsaraDB即将上线的GreenPlum服务,要比社区快100倍?
首先解释下这个100倍是指分区表插入速度快100倍。其原理:分区表插入关键是判断一个插入值属于哪个分区。社区版是采用触发器实现:
1)需要调用触发器的逻辑,代码链路很长,导致执行慢。
2)需要使用遍历的方式来判定一个值所属分区,非常低效。在分区较多(比如几百个分区)时,会很慢。分区越多,速度越慢。
而 ApsaraDB for GreenPlum的方法 :
1)无需调用复杂的触发器逻辑
2)采用二分法遍历分区的临界值,算法由O(N)降至O(logN)
五、叶翔:传说会丢数据的数据库,为什么会成为新的趋势?
一个丢数据的数据库是不可能如此流行,“传说”更准确的说是“谣言”。
MongoDB是非常灵活和可靠的数据库,用户可以自行配置写入可靠性级别,所以往往是误用了低可靠性参数而造成了一定概率的丢失。MongoDB的文档型数据结构与面向对象编程有天然的兼容性,数据建模非常容易上手。并且其支持高可用的复制集,灵活的分区功能等,这些核心功能促进了MongoDB的崛起。MongoDB在互联网对NoSQL的需求浪潮下,没有不火的道理。
阿里云也是趁胜追击推出了MongoDB云服务。提供了更高的可靠性,背后还具有非常专业的MongoDB源码团队支撑。也欢迎大家前来使用,与阿里云一起享受NoSQL红利。
六、叶翔:NoSQL数据库如何选型?
一般来说,NoSQL数据库选型需要从数据模型和存储特性两方面综合考虑,拿最流行的三个NoSQL数据来举例:
1)数据模型:
文档型:MongoDB
KV型:Memcache
复杂KV型:Redis
2)存储特性上:
持久化需求高数据量大,作为核心数据源,或者有轻度计算需求的:MongoDB
对性能要求极致,不担心数据丢失的选择:Memcache
数据生命周期短,数据量相对小,性能要求高:Redis
七、叶翔:NewSQL又是什么鬼?
简单的来说:SQL+NoSQL=NewSQL。 NewSQL被定义为下一代数据库的发展方向。甚至在今天的数据库特性上已经可以看到这个趋势:最流行的开源关系型数据库:MySQL ,从5.7版本开始具有JSON,KV解决方案;而最流行的NoSQL数据库:MongoDB,也推出Join解决方案。
SQL与NoSQL的界限逐渐在模糊,甚至传统关系型数据库PostgreSQL可以利用FDW让MongoDB作为其数据源。所以,不论SQL也好,NoSQL也好,都会以NewSQL的形态展现。
八、玄惭:《云数据库十大经典案例》满满全是干货,直接放PPT可以吗?
《云数据库十大经典案例》以MySQL数据库为例,收集整理了自阿里云数据库团队至今,用户在使用RDS过程中最常见的问题。包括:
1)索引
2)sql优化
3)锁
4)延迟
5)参数优化
6)连接数
7)cpu
8)iops
9)磁盘
10)内存
每个案例的背后都是活生生的生产故障,希望通过这些案例的总结还原问题原貌,给出分析问题的思路。也许有一天,当你遇到类似问题的时候能够触类旁通,举一反三,快速解决问题。
最佳实践收集了阿里云多年在数据库上的开发经验和内核团队在MySQL上的优化实践,以及众多专家在处理各类问题后积累下来的最佳实践,希望用户能够在使用云数据库的路上少一些弯路,多一些从容。