趙大寶寶
大數(shù)據(jù)工程師要學(xué)什么課程?沒接觸過大數(shù)據(jù)的人也許不知道大數(shù)據(jù)工程師是什么,更別說知道大數(shù)據(jù)工程師要學(xué)什么課程了。我們先來說下大數(shù)據(jù)工程師是做什么的吧。是負(fù)責(zé)公司互聯(lián)網(wǎng)數(shù)據(jù)分析的一個(gè)職位,對(duì)數(shù)據(jù)庫(kù)進(jìn)行開發(fā)和(或)維護(hù),需要具備超強(qiáng)的邏輯思維,精通各種語言,需要有相當(dāng)好的毅力和耐心。光環(huán)大數(shù)據(jù)的大數(shù)據(jù)培訓(xùn)課程分為如下幾個(gè)階段:第一階段:java核心學(xué)習(xí)學(xué)習(xí)內(nèi)容:Java核心內(nèi)容學(xué)習(xí)目標(biāo):掌握數(shù)據(jù)類型與運(yùn)算符,數(shù)組、類與對(duì)象;掌握IO流與反射、多線程、JDBC。完成目標(biāo):Java多線程模擬多窗口售票,Java集合框架管理。第二階段: JavaEE課程大綱學(xué)習(xí)內(nèi)容:JavaEE核心內(nèi)容學(xué)習(xí)目標(biāo):Mysql數(shù)據(jù)基礎(chǔ)知識(shí),Jdbc 基礎(chǔ)概念和操作掌握HTML和CSS語法、Java核心語法完成目標(biāo):京東電商網(wǎng)站項(xiàng)目、2048小游戲。第三階段:Linux精講學(xué)習(xí)內(nèi)容:Linux命令、文件、配置,Shell、Awk、Sed學(xué)習(xí)目標(biāo):搭建負(fù)載均衡、高可靠的服務(wù)器集群,可大網(wǎng)站并發(fā)訪問量,保證服務(wù)不間斷完成目標(biāo):Linux環(huán)境搭建、shell腳本小游戲 貪吃蛇。第四階段:Hadoop生態(tài)體系學(xué)習(xí)內(nèi)容:HDFS、MapReduce、Hive、Sqoop、Oozie學(xué)習(xí)目標(biāo):掌握HDFS原理、操作和應(yīng)用開發(fā),掌握分布式運(yùn)算、Hive數(shù)據(jù)倉(cāng)庫(kù)原理及應(yīng)用。完成目標(biāo):微博數(shù)據(jù)大數(shù)據(jù)分析、汽車銷售大數(shù)據(jù)分析第五階段:Storm實(shí)時(shí)開發(fā)學(xué)習(xí)內(nèi)容:Zookeeper、HBase、Storm實(shí)時(shí)數(shù)據(jù)學(xué)習(xí)目標(biāo):掌握Storm程序的開發(fā)及底層原理,具備開發(fā)基于Storm的實(shí)時(shí)計(jì)算程序的能力。完成目標(biāo):實(shí)時(shí)處理新數(shù)據(jù)和更新數(shù)據(jù)庫(kù),處理密集查詢并行搜索處理大集合的數(shù)據(jù)。
虎寶寶001
一般來說大數(shù)據(jù)培訓(xùn)就是5個(gè)月左右的時(shí)間,
大數(shù)據(jù)學(xué)習(xí)內(nèi)容
第1階段Java
第2階段JavaEE核心
第3階段Hadoop生態(tài)體系
第4階段大數(shù)據(jù)spark生態(tài)體系
大數(shù)據(jù)學(xué)習(xí)內(nèi)容
卷卷卷和毛
大數(shù)據(jù)培訓(xùn)面授起碼要半年的時(shí)間,機(jī)構(gòu)和機(jī)構(gòu)學(xué)習(xí)的時(shí)間可以能有差異大體上都是半年,希望對(duì)你有所幫助。
得幫小趙
大大數(shù)據(jù)開發(fā)工程師要學(xué)習(xí)哪些課程大數(shù)據(jù)開發(fā)工程師要學(xué)習(xí)哪些大數(shù)據(jù)開發(fā)工程師要學(xué)習(xí)哪些課程
番茄小清新
參加大數(shù)據(jù)開發(fā)培訓(xùn)需要掌握以下幾個(gè)方向的內(nèi)容。
階段一:JavaSE基礎(chǔ)核心
1、深入理解Java面向?qū)ο笏枷?/p>
2、掌握開發(fā)中常用基礎(chǔ)API
3、熟練使用集合框架、IO流、異常
4、能夠基于JDK8開發(fā)
階段二:Hadoop生態(tài)體系架構(gòu)
1、Linux系統(tǒng)的安裝和操作
2、熟練掌握Shell腳本語法
3、Idea、Maven等開發(fā)工具的使用
4、Hadoop組成、安裝、架構(gòu)和源碼深度解析,以及API的熟練使用
5、Hive的安裝部署、內(nèi)部架構(gòu)、熟練使用其開發(fā)需求以及企業(yè)級(jí)調(diào)優(yōu)
6、Zookeeper的內(nèi)部原理、選舉機(jī)制以及大數(shù)據(jù)生態(tài)體系下的應(yīng)
階段三:Spark生態(tài)體系架構(gòu)
1、Spark的入門安裝部署、Spark Core部分的基本API使用熟練、RDD編程進(jìn)階、累加器和廣播變量的使用和原理掌握、Spark SQL的編程掌握和如何自定義函數(shù)、Spark的內(nèi)核源碼詳解(包括部署、啟動(dòng)、任務(wù)劃分調(diào)度、內(nèi)存管理等)、Spark的企業(yè)級(jí)調(diào)優(yōu)策略
2、DophineScheduler的安裝部署,熟練使用進(jìn)行工作流的調(diào)度執(zhí)行
3、了解數(shù)據(jù)倉(cāng)庫(kù)建模理論,充分熟悉電商行業(yè)數(shù)據(jù)分析指標(biāo)體系,快速掌握多種大數(shù)據(jù)技術(shù)框架,了解認(rèn)識(shí)多種數(shù)據(jù)倉(cāng)庫(kù)技術(shù)模塊
4、HBase和Phoenix的部署使用、原理架構(gòu)講解與企業(yè)級(jí)優(yōu)化
5、開發(fā)工具Git&Git Hub的熟練使用
6、Redis的入門、基本配置講解、jedis的熟練掌握
7、ElasticSearch的入門安裝部署及調(diào)優(yōu)
8、充分理解用戶畫像管理平臺(tái)的搭建及使用、用戶畫像系統(tǒng)的設(shè)計(jì)思路,以及標(biāo)簽的設(shè)計(jì)流程及應(yīng)用,初步了解機(jī)器學(xué)習(xí)算法
9、獨(dú)立構(gòu)建功能完全的企業(yè)級(jí)離線數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目,提升實(shí)戰(zhàn)開發(fā)能力,加強(qiáng)對(duì)離線數(shù)據(jù)倉(cāng)庫(kù)各功能模塊的理解認(rèn)知,實(shí)現(xiàn)多種企業(yè)實(shí)戰(zhàn)需求,累積項(xiàng)目性能調(diào)優(yōu)經(jīng)驗(yàn)
階段四:Flink生態(tài)體系架構(gòu)
1、熟練掌握Flink的基本架構(gòu)以及流式數(shù)據(jù)處理思想,熟練使用Flink多種Soure、Sink處理數(shù)據(jù),熟練使用基本API、Window API 、狀態(tài)函數(shù)、Flink SQL、Flink CEP復(fù)雜事件處理等
2、使用Flink搭建實(shí)時(shí)數(shù)倉(cāng)項(xiàng)目,熟練使用Flink框架分析計(jì)算各種指標(biāo)
3、ClickHouse安裝、使用及調(diào)優(yōu)
4、項(xiàng)目實(shí)戰(zhàn)。貼近大數(shù)據(jù)的實(shí)際處理場(chǎng)景,多維度設(shè)計(jì)實(shí)戰(zhàn)項(xiàng)目,能夠更廣泛的掌握大數(shù)據(jù)需求解決方案,全流程參與項(xiàng)目打造,短時(shí)間提高學(xué)生的實(shí)戰(zhàn)水平,對(duì)各個(gè)常用框架加強(qiáng)認(rèn)知,迅速累積實(shí)戰(zhàn)經(jīng)驗(yàn)
5、可選掌握推薦和機(jī)器學(xué)習(xí)項(xiàng)目,熟悉并使用系統(tǒng)過濾算法以及基于內(nèi)容的推薦算法等
6、采用阿里云平臺(tái)全套大數(shù)據(jù)產(chǎn)品重構(gòu)電商項(xiàng)目,熟悉離線數(shù)倉(cāng)、實(shí)時(shí)指標(biāo)的阿里云解決方案
階段五:就業(yè)指導(dǎo)
1、從技術(shù)和項(xiàng)目?jī)蓚€(gè)角度按照企業(yè)面試、
2、熟悉CDH在生產(chǎn)環(huán)境中的使用
3、簡(jiǎn)歷指導(dǎo)
以上為大數(shù)據(jù)培訓(xùn)所要掌握的內(nèi)容,當(dāng)然也可以嘗試自學(xué)的。
優(yōu)質(zhì)工程師考試問答知識(shí)庫(kù)