RethinkDB 来了!| 1KE 独家合作伙伴授权内容
数据处理
RethinkDB
Open-Source Database
6人收藏 4875次学习

RethinkDB 来了!| 1KE 独家合作伙伴授权内容

创始人欢迎视频

两分钟介绍RethinkDB

RethinkDB八问

什么是RethinkDB?

RethinkDB 是从头打造的第一个开源、可扩展的JSON数据库,用于搭建实时网页。全新的访问模型颠覆了传统的数据库结构:开发者只需告诉RethinkDB,实时连续地将查询更新结果推送到应用就可以了,不用每次都去poll一遍。RethinkDB的实时推送结构为搭建可扩展实时应用节省了大量时间精力。

除了为实时应用提供了全新的设计之外,RethinkDB 还提供了一种灵活的查询语言、直观的操作和监控API,安装学习起来也非常容易。

你可以查看这篇 Advancing the realtime web 得到更多RethinkDB计划的技术细节。

什么时候RethinkDB是一个好的选择?

当你的应用很大程度上有赖于数据的实时反馈时,RethinkDB 就会成为一个很棒的选择。

“查询-响应”式的数据库访问模型在web上的确很有用,它可以直接映射到HTTP的“请求-响应”。而现代应用则需要将数据直接实时地传送到客户端。能够最大化得益于RethinkDB实时推送架构的例子包括:

  • 协作网站和移动应用
  • 数据流分析应用
  • 多人在线游戏
  • 实时交易场所
  • 设备联机

举个例子:在协作设计一个app的时候,其中一个用户改变了某个按钮的位置,服务器就必须在第一时间通知所有在完成同一项目的其他用户。网页浏览器能够通过WebSockets和http持久连接来支持这一功能,但数据库系统要迎合实时需求仍然是一个大的工程难题。而RethinkDB作为第一个开源、可扩展的数据库,就是特别为实时推送数据到应用而设计的。

哪些人在用 RethinkDB?

RethinkDB 的用户包括上百个科技创业公司、咨询工作室和世界五百强企业。这里是其中的一些:

RethinkDB 拥有超过十万开发者的活跃社区和上百个来自世界各地的代码贡献者。

RethinkDB是基于现有技术的吗?

高效实现实时推送架构需要重新设计绝大部分的数据库成分,包括查询执行引擎、分布式系统、超高速缓存子系统和存储引擎。因为架构影响到每一个数据库组成部分,RethinkDB不得不从C++ 开始一步步写起来。RethinkDB 是由数据库专家组成的团队花了五年时间做出来的,还得到了来自世界各地上百个代码贡献者的帮助。

RethinkDB和realtime sync不同在哪里?

FirebasePubNub 或者Pusher 这类实时同步API相比,RethinkDB主要不同在以下三个方面:

首先,实时同步API是云服务,而RethinkDB 是开源项目。RethinkDB也有云端,可以通过我们的合作伙伴 Compose.io 和 Amazon AWS获得。它还可以部署在你自己的架构中,没有任何限制。

其次,同步实时API只局限于同步文档,而RethinkDB是一个有着更普遍应用范围的数据库系统。 在RethinkDB中你可以运行任意query,包括table joins, subqueries, geospatial queries, aggregation, 还有map-reduce。实时同步服务有更多查询功能上的限制。

最后,实时同步API的设计是直接从浏览器访问。这使得基本的app能够快速地跑起来,然而一旦app扩展了,灵活性就会受到限制。RethinkDB的设计是从应用服务器进行访问,这一点上更像是传统的数据库。可能会要多花一点设置代码,但拥有足够的灵活性去适应应用的成熟。

RethinkDB和MongoDB又不同在哪里?

RethinkDB所基于的架构和MongoDB非常不同。开发者只需告诉RethinkDB,实时连续地将查询更新结果推送到应用就可以了,不用每次都去poll一遍。你同样可以在RethinkDB上用传统的“查询-响应”范式来书写应用。然后在你开始为app添加实时功能时再去订阅实时数据流。

举个例子,这是你让RethinkDB查询一个文件时的命令:

r.table('users').get('coffeemug').run()

然后这是你从RethinkDB订阅更新流时用到的语句,在任何时候文档发生了变化就会推送:

r.table('users').get('coffeemug').changes().run()

RethinkDB的实时架构可以和MongoDB的oplog相提并论,但前者提供了更高层次的抽象。RethinkDB的数据流与查询计算引擎无缝整合,并允许你订阅查询结果的变化,而不仅仅是把数据复制过来。这种架构大幅度地减少了搭建实时app所需的时间和精力。

除了实时推送架构,RethinkDB 还有许多胜过 MongoDB的地方:

  • 一种高级的查询语言,能够支持table joins, subqueries 和大规模并行式分布计算。
  • 融合了查询语言的操作和监控API,大幅度降低了RethinkDB扩展的难度。
  • 简洁美观的UI 易于复制转发,拥有在线文档支持和查询语言建议。

可以看看这篇 technical comparison of RethinkDB and MongoDB 里面的评论比较中立一些。想听听个人观点的,请看@coffeemug 的what makes RethinkDB different.

什么时候RethinkDB是一个不好的选择?

当你需要用到完整ACID支持或者更强大的架构实施,RethinkDB就不大好用了。在这种情况下你最好用一些传统的MySQL或者PostgreSQL数据库。

如果你需要做深度、密集型计算分析的话,你最好用Hadoop或者类似于Verticaa的面向列的存储工具。

在某些情况下RethinkDB会在一定程度上牺牲书写可用性(write availability)来保证数据一致性(data consistency)。如果高要求的书写可用性对你来讲很重要,那你也不要纠结了,像Riak这样的Dynamo式系统可能更适合你。

想要更多地学习RethinkDB?

加入1KE学习俱乐部

1KE学习俱乐部是只针对1KE学员开放的私人俱乐部