Loading...
大数据技术考试复习知识点
人工智能归根结底就是统计学,学科计算机与统计学就是人工智能。
MapReduce:验证、WordCount源码分析、MapReduce内部流程、自定义组件、Combiner和压缩优化传输等
Hadoop客户端环境搭载、数据流、NameNode、SecondaryNode、DataNode 实战
HBase:环境搭载、HBase+MapReduce等
本文延续[Linux]虚拟机CentOS7集群环境搭载,为后续MapReduce学习搭载Hadoop。
HDFS简述HDFS(Hadoop Distributed File System),作为Google File System(GFS)的实现,是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服务器上。
虚拟机CentOS7.7集群环境搭载,为后续Hadoop学习提供准备。