【課程內容】
1、Hadoop分布式文件系統(HDFS)
2、YARN/MapReduce的工作原理
3、如何優化Hadoop機群所需要的硬件配置
4、搭建Hadoop機群所需要考慮的網絡因素
5、Hadoop機群維護和控制
6、如何利用Hadoop配置選項進行系統性能調優
7、如何利用FairScheduler為多用戶提供服務級別保障
8、Hadoop機群維護和監控
9、如何使用Flume從動態生成的文件加載到Hadoop
10、如何使用Sqoop從關系型數據加載數據
11、Hadoop生態系統工具(如Hive、Impala、Pig和Base)
上海市信息技術培訓中心Cloudera Hadoop開發認證培訓
1、Hadoop分布式文件系統(HDFS)和MapReduce的工作原理
2、如何利用JAVA API或者其他編程語言來開發MapReduce應用
3、MapReduce任務開發中的注意事項
4、如何在Hadoop上實現常見算法
5、Hadoop開發和調試的*實用經驗
6、如何利用其他Hadoop相關技術,包括Apache Hive, Apache Pig, Sqoop和Oozie等
7、滿足解決實際數據分析問題的高級Hadoop API
上海市信息技術培訓中心Cloudera數據分析培訓
【課程內容】 1、Hive如何擴展MapReduce
2、如何使用Hive創建和操作表
3、Hive基本和高級數據類型
· 4、對數據進行分區和分組
5、如何用Pig加載和操作數據
6、PigLatin編程語言的特性
7、用Pig解決實際數據分析問題
8、使用Impala分析數據
上海市信息技術培訓中心Cloudera HBase培訓
【課程內容】
1、理解HBase體系結構及應用場景
2、使用HBase Shell來直接操作HBase數據庫
3、使用JAVA及Thrift API訪問及操作HBase數據庫系統
4、如何管理HBase機群,發現和解決性能問題
5、如何優化HBase數據模式來進行高效地數據存儲和數據恢復