商丘大數(shù)據(jù)分析培訓(xùn)
來(lái)源:
奇酷教育 發(fā)表于:
課程重點(diǎn)培養(yǎng)學(xué)員基于Hadoop架構(gòu)的大數(shù)據(jù)分析實(shí)操能力,從零開(kāi)始學(xué)習(xí)Scala編程,掌握Spark,手把手帶練,3個(gè)月成為行業(yè)急需的大數(shù)據(jù)開(kāi)
課程重點(diǎn)培養(yǎng)學(xué)員基于Hadoop架構(gòu)的
大數(shù)據(jù)分析實(shí)操能力,從零開(kāi)始學(xué)習(xí)Scala編程,掌握Spark,手把手帶練,3個(gè)月成為行業(yè)急需的大數(shù)據(jù)開(kāi)發(fā)人才。講解案例包括但不限于金融
大數(shù)據(jù)分析、氣象
大數(shù)據(jù)分析、Web海量日志
大數(shù)據(jù)分析、智慧高速
大數(shù)據(jù)分析等。
01、大數(shù)據(jù)行業(yè)前沿應(yīng)用與知識(shí)介紹;02、大數(shù)據(jù)分析師課程安排;03、Linux入門(mén)基礎(chǔ);04、Hadoop入門(mén)介紹;
05、Hadoop單機(jī)環(huán)境搭建;06、Hadoop偽分布式集群搭建;07、Hadoop完全分布式集群搭建
第二章:Hadoop核心組建使用方法
01、分布式文件系統(tǒng)HDFS架構(gòu)原理及常用指令;02、HDFS編程入門(mén);03、Hbase編程入門(mén);04、分布式數(shù)據(jù)倉(cāng)庫(kù)Hive架構(gòu)原理及HQL語(yǔ)法介紹;
05、分布式計(jì)算引擎MapReduce架構(gòu)原理及基本使用方法;06、資源調(diào)度器YARN基本原理;07、ETL工具Sqoop使用方法
第三章:分布式計(jì)算引擎Spark入門(mén)
01、Scala語(yǔ)法知識(shí)介紹 ;02、Spark架構(gòu)特點(diǎn)及基本原理;03、Spark入門(mén)及安裝部署方法;04、Spark Core介紹;
05、Spark SQL介紹與數(shù)據(jù)讀取、保存方法;06、Spark GraphX入門(mén)及基本使用方法 ;07、Spark GraphX圖計(jì)算算法案例。
第四章:Spark核心組件的使用方法
01、日志采集系統(tǒng)Flume和分布式消息隊(duì)列Kafka入門(mén);02、流式計(jì)算框架Spark Streaming基本原理及使用方法;03、流式計(jì)算框架Structured Streaming基本原理及使用方法;
04、分布式算法庫(kù)Spark MlLib入門(mén)介紹;05、Spark ML與Spark MLLib;06、機(jī)器學(xué)習(xí)工作流。
第五章:Pyspark基礎(chǔ)知識(shí)
01、Spark數(shù)據(jù)結(jié)構(gòu)及編程語(yǔ)言接口;02、PySpark開(kāi)發(fā)環(huán)境搭建;03、PySpark編程入門(mén):Spark基本數(shù)據(jù)結(jié)構(gòu);
04、PySpark編程入門(mén):PySpark常用語(yǔ)句;05、Spark與分布式數(shù)據(jù)庫(kù)和分布式數(shù)據(jù)倉(cāng)庫(kù)的集成方法;06、采用PySpark讀取分布式數(shù)據(jù)庫(kù)中數(shù)據(jù);07、 PySpark數(shù)據(jù)清洗案例。
以上就是
奇酷老師為大家分享的“
商丘大數(shù)據(jù)分析培訓(xùn)”謝謝大家觀看,如果對(duì)大數(shù)據(jù)感興趣的話,想學(xué)
大數(shù)據(jù)培訓(xùn)的,可以在線咨詢我們,我們將竭誠(chéng)為你解答。