Hadoop生态系统

Hadoop基础

  • 用户的概念
    (1) 用户(User):Hadoop使用Linux用户管理,Hadoop中的用户就是Linux中的用户
    (2) 分组(group):Hadoop使用Linux分组管理,Hadoop中的分组就是Linux中的分组
    (3) 池(pool):Hadoop Fair Scheduler中的概念,一个pool可以是一个user,一个group,或者一个queue。
    (4) 队列(Queue):队列是Hadoop提出的概念,一个Queue可以由任意几个Group和任意几个User组成。

flume

kafka

spark