所有栏目 | 云社区 美国云服务器[国内云主机商]
你的位置:首页 > 云社区 » 正文

大数据生态系统中各个组件怎么用?

发布时间:2020-04-15 16:48:37

资讯分类:组件  大数据  生态  系统  分布式  这是  利用
大数据生态系统中各个组件怎么用?

搜索引擎,Doug Cutting设计Hadoop的初衷,就是为了针对大规模的网页快速建立索引。

大数据存储,利用Hadoop的分布式存储能力,例如数据备份、数据仓库等。

大数据处理,利用Hadoop的分布式处理能力,例如数据挖掘、数据分析等。 Hadoop生态系统与基础组件 Hadoop2.0的时候引入了HA(高可用)与YARN(资源调度),这是与1.0的最大差别。Hadoop主要由3部分组成:Mapreduce编程模型,HDFS分布式文件存储,与YARN。

留言与评论(共有 0 条评论)
   
验证码:
Top