首頁>國企·民企>深·觀察深·觀察
數據挖掘如何就業?
5. hadoop,hive之類的需要學習嗎?
我覺得應當學習,首先Hadoop和Hive很簡單(如果你用AWS的話你可以開一臺EMR,上面直接就有Hadoop和Hive,可以直接從使用學起)。
我覺得如果不折騰安裝和部署,還有Linux和MySQL的經驗,只要半天到一天就能熟悉Hadoop和Hive的使用(當然你得有Linux和MySQL的基礎,如果沒有就先老老實實的學Linux和MySQL,這兩個都可以在自己的PC上安裝,自己折騰)。
Spark對很多人來說才是需要學習的,如果你有JAVA經驗大可以從JAVA入門。如果沒有那么還是建議從Scala入門,但是實際上如果沒有JAVA經驗,Scala入門也會有一定難度,但是可以慢慢補。
所以總的來說Spark才足夠難,以至于需要學習。
最后的最后我有一些建議。第一要對自己有一個系統的認知,自己的編程水平夠么,SQL會用么,Linux會用么,能流暢的看英文文檔么?
如果上面任何一個問題的答案是No,我都不建議直接轉行或者申請高級的數據挖掘職位(因為你很難找到一個正經的數據挖掘崗位,頂多是一些打擦邊球的崗位,無論是實際干的工作還是未來的成長可能對你的幫助都不大)。
無論你現在是學生還是已經再做一些前段后端、運維之類的工作你都有足夠的時間補齊這些基礎知識。
補齊了這些知識之后,第一件事就是了解大數據生態,Hadoop生態圈,Spark生態圈,機器學習,深度學習(后兩者需要高等數學和線性代數基礎,如果你的大學專業學這些不要混)。
選定其中一個方向做一些鉆研和學習,網上有很多現成的資料(基本上是英文的,所以我說了,不能看英文的趕緊去背單詞),科學上網用谷歌這個大家都懂。希望我的建議能對你有一些幫助。
編輯:梁霄
關鍵詞:數據 挖掘 學習 公司 算法 機器 生態圈