Storm 文档-学文库

全部分类行业资料技术资料管理文献经济文库考试资料教学课件

相关文档

COMMENT ON THE STORM

01_流式计算基础_第1天（Storm是什么、Storm核心组件、Storm编程模型）

最新文档

企业国际市场进入模式选择研究现状述评

转诊转院制度督查转诊转院制度及流程(四篇)

企业在食品安全大会汇报发言稿

企业基本情况表

2024年贫困户申请书咋写个人申请贫困户申请书(8篇)

企业培训管理的量化指标kpi方法

七年级语文教学计划(通用13篇)

方剂学歌修改版无错字新世纪第二版重点

企业外部薪酬调查表

最新半年个人工作总结(精选13篇)

企业培训计划

企业基本信息表

企业如何实施绩效管理优秀PPT

企业基本情况一览表

教学秘书的工作总结与经验分享大全（21篇）

在线预览结束，喜欢就下载吧，查找使用更方便

16 金币

/ 5

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

StromStrom简介Storm是一个分布式的、容错的实时计算系统。Storm是由BackType开发的实时处理系统，BackType现在已在Twitter麾下。GitHub上的最新版本是Storm0.5.2，基本是用HYPERLINK"http://www.oschina.net/p/clojure"Clojure写的。Storm为分布式实时计算提供了一组通用原语，可被用于“流处理”之中，实时处理消息并更新数据库。这是管理队列及工作者集群的另一种方式。Storm也可被用于“连续计算”（continuouscomputation），对数据流做连续查询，在计算时就将结果以流的形式输出给用户。它还可被用于“分布式RPC”，以并行的方式运行昂贵的运算。Storm的主工程师NathanMarz表示：Storm可以方便地在一个计算机集群中编写与扩展复杂的实时计算，Storm之于实时处理，就好比HYPERLINK"http://www.oschina.net/p/hadoop"Hadoop之于批处理。Storm保证每个消息都会得到处理，而且它很快——在一个小集群中，每秒可以处理数以百万计的消息。更棒的是你可以使用任意编程语言来做开发。Storm的主要特点如下简单的编程模型。类似于HYPERLINK"http://www.oschina.net/p/mapreduce"MapReduce降低了并行批处理复杂性，Storm降低了进行实时处理的复杂性。可以使用各种编程语言。你可以在Storm之上使用各种编程语言。默认支持Clojure、Java、Ruby和Python。要增加对其他语言的支持，只需实现一个简单的Storm通信协议即可。容错性。Storm会管理工作进程和节点的故障。水平扩展。计算是在多个线程、进程和服务器之间并行进行的。可靠的消息处理。Storm保证每个消息至少能得到一次完整处理。任务失败时，它会负责从消息源重试消息。快速。系统的设计保证了消息能得到快速的处理，使用HYPERLINK"http://www.oschina.net/p/0mq"ØMQ作为其底层消息队列。本地模式。Storm有一个“本地模式”，可以在处理过程中完全模拟Storm集群。这让你可以快速进行开发和单元测试。Storm集群由一个主节点和多个工作节点组成。主节点运行了一个名为“Nimbus”的守护进程，用于分配代码、布置任务及故障检测。每个工作节点都运行了一个名为“Supervisor”的守护进程，用于监听工作，开始并终止工作进程。Nimbus和Supervisor都能快速失败，而且是无状态的，这样一来它们就变得十分健壮，两者的协调工作是由ApacheHYPERLINK"http://www.oschina.net/p/zookeeper"ZooKeeper来完成的。Storm的术语包括Stream、Spout、Bolt、Task、Worker、StreamGrouping和Topology。Stream是被处理的数据。Sprout是数据源。Bolt处理数据。Task是运行于Spout或Bolt中的线程。Worker是运行这些线程的进程。StreamGrouping规定了Bolt接收什么东西作为输入数据。数据可以随机分配（术语为Shuffle），或者根据字段值分配（术语为Fields），或者广播（术语为All），或者总是发给一个Task（术语为Global），也可以不关心该数据（术语为None），或者由自定义逻辑来决定（术语为Direct）。Topology是由StreamGrouping连接起来的Spout和Bolt节点网络。在HYPERLINK"https://github.com/nathanmarz/storm/wiki/Concepts"StormConcepts页面里对这些术语有更详细的描述可以和Storm相提并论的系统有Esper、Streambase、HStreaming和YahooS4。其中和Storm最接近的就是S4。两者最大的区别在于Storm会保证消息得到处理。这些系统中有的拥有内建数据存储层，这是Storm所没有的，如果需要持久化，可以使用一个类似于Cassandra或Riak这样的外部数据库。可以和Storm相提并论的系统有HYPERLINK"http://esper.codehaus.org/"Esper、HYPERLINK"http://www.streambase.com/"Streambase、HYPERLINK"http://www.hstreaming.com/"HStreaming和HYPERLINK"http://s4.io/