首頁(yè)>國(guó)企·民企>深·觀察深·觀察
數(shù)據(jù)挖掘如何就業(yè)?
5. hadoop,hive之類的需要學(xué)習(xí)嗎?
我覺(jué)得應(yīng)當(dāng)學(xué)習(xí),首先Hadoop和Hive很簡(jiǎn)單(如果你用AWS的話你可以開(kāi)一臺(tái)EMR,上面直接就有Hadoop和Hive,可以直接從使用學(xué)起)。
我覺(jué)得如果不折騰安裝和部署,還有Linux和MySQL的經(jīng)驗(yàn),只要半天到一天就能熟悉Hadoop和Hive的使用(當(dāng)然你得有Linux和MySQL的基礎(chǔ),如果沒(méi)有就先老老實(shí)實(shí)的學(xué)Linux和MySQL,這兩個(gè)都可以在自己的PC上安裝,自己折騰)。
Spark對(duì)很多人來(lái)說(shuō)才是需要學(xué)習(xí)的,如果你有JAVA經(jīng)驗(yàn)大可以從JAVA入門。如果沒(méi)有那么還是建議從Scala入門,但是實(shí)際上如果沒(méi)有JAVA經(jīng)驗(yàn),Scala入門也會(huì)有一定難度,但是可以慢慢補(bǔ)。
所以總的來(lái)說(shuō)Spark才足夠難,以至于需要學(xué)習(xí)。
最后的最后我有一些建議。第一要對(duì)自己有一個(gè)系統(tǒng)的認(rèn)知,自己的編程水平夠么,SQL會(huì)用么,Linux會(huì)用么,能流暢的看英文文檔么?
如果上面任何一個(gè)問(wèn)題的答案是No,我都不建議直接轉(zhuǎn)行或者申請(qǐng)高級(jí)的數(shù)據(jù)挖掘職位(因?yàn)槟愫茈y找到一個(gè)正經(jīng)的數(shù)據(jù)挖掘崗位,頂多是一些打擦邊球的崗位,無(wú)論是實(shí)際干的工作還是未來(lái)的成長(zhǎng)可能對(duì)你的幫助都不大)。
無(wú)論你現(xiàn)在是學(xué)生還是已經(jīng)再做一些前段后端、運(yùn)維之類的工作你都有足夠的時(shí)間補(bǔ)齊這些基礎(chǔ)知識(shí)。
補(bǔ)齊了這些知識(shí)之后,第一件事就是了解大數(shù)據(jù)生態(tài),Hadoop生態(tài)圈,Spark生態(tài)圈,機(jī)器學(xué)習(xí),深度學(xué)習(xí)(后兩者需要高等數(shù)學(xué)和線性代數(shù)基礎(chǔ),如果你的大學(xué)專業(yè)學(xué)這些不要混)。
選定其中一個(gè)方向做一些鉆研和學(xué)習(xí),網(wǎng)上有很多現(xiàn)成的資料(基本上是英文的,所以我說(shuō)了,不能看英文的趕緊去背單詞),科學(xué)上網(wǎng)用谷歌這個(gè)大家都懂。希望我的建議能對(duì)你有一些幫助。
編輯:梁霄
關(guān)鍵詞:數(shù)據(jù) 挖掘 學(xué)習(xí) 公司 算法 機(jī)器 生態(tài)圈
更多
更多
更多
- 供給側(cè)改革中的大國(guó)糧倉(cāng)——中央儲(chǔ)備糧管理工作綜述
- “黃土地”刷出“新顏值”:延安兩千萬(wàn)畝“林?!闭Q生
- 廣深港高鐵香港段運(yùn)營(yíng)備忘錄簽署 初期有127對(duì)列車運(yùn)行
- 銷售弱于預(yù)期?蘋果市值一周內(nèi)蒸發(fā)數(shù)百億美元
- 精準(zhǔn)施策攻克深度貧困——地方兩會(huì)代表委員談打好脫貧
- 網(wǎng)絡(luò)平臺(tái)“利潤(rùn)至上”行不通
- 公共平臺(tái)別成輿論賣場(chǎng)
- 媒體談獨(dú)生子女護(hù)理假:別因落實(shí)難離了初衷涼了人心
- 地方兩會(huì)開(kāi)出“綠色清單”升級(jí)版 打好污染防治攻堅(jiān)戰(zhàn)