爆米花也是花
,一葉一菩提
一、《Presto技術(shù)內(nèi)幕》二、《為數(shù)據(jù)而生》三、《智能時(shí)代》四、《R語言預(yù)測實(shí)戰(zhàn)》五、《大數(shù)據(jù)處理之道》六、《大數(shù)據(jù)基礎(chǔ)與應(yīng)用》七、《超越大數(shù)據(jù)》

lin10241121
在人人高呼的大數(shù)據(jù)時(shí)代,你是想繼續(xù)做一個(gè)月薪6K+的碼農(nóng),還是想要翻身學(xué)習(xí)成為炙手可熱名企瘋搶的大數(shù)據(jù)工程師呢?隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,大數(shù)據(jù)行業(yè)前景非常被看好,有很多朋友對大數(shù)據(jù)行業(yè)心向往之,卻苦于不知道該如何下手,或者說學(xué)習(xí)大數(shù)據(jù)不知道應(yīng)該看些什么書。作為一個(gè)零基礎(chǔ)大數(shù)據(jù)入門學(xué)習(xí)者該看哪些書?今天就給大家分享幾本那些不容錯(cuò)過的大數(shù)據(jù)書籍。1、《數(shù)據(jù)挖掘》這是一本關(guān)于數(shù)據(jù)挖掘領(lǐng)域的綜合概述,本書前版曾被KDnuggets的讀者評(píng)選為最受歡迎的數(shù)據(jù)挖掘?qū)V?,是一本可讀性極佳的教材。它從數(shù)據(jù)庫角度全面系統(tǒng)地介紹數(shù)據(jù)挖掘的概念、方法和技術(shù)以及技術(shù)研究進(jìn)展,并重點(diǎn)關(guān)注近年來該領(lǐng)域重要和最新的課題——數(shù)據(jù)倉庫和數(shù)據(jù)立方體技術(shù),流數(shù)據(jù)挖掘,社會(huì)化網(wǎng)絡(luò)挖掘,空間、多媒體和其他復(fù)雜數(shù)據(jù)挖掘。2、《Big Data》這是一本在大數(shù)據(jù)的背景下,描述關(guān)于數(shù)據(jù)建模,數(shù)據(jù)層,數(shù)據(jù)處理需求分析以及數(shù)據(jù)架構(gòu)和存儲(chǔ)實(shí)現(xiàn)問題的書。這本書提供了令人耳目一新的全面解決方案。但不可忽略的是,它也引入了大多數(shù)開發(fā)者并不熟悉的、困擾傳統(tǒng)架構(gòu)的復(fù)雜性問題。本書將教你充分利用集群硬件優(yōu)勢的Lambda架構(gòu),以及專門用來捕獲和分析網(wǎng)絡(luò)規(guī)模數(shù)據(jù)的新工具,來創(chuàng)建這些系統(tǒng)。3、《Mining of Massive Datasets》這是一本書是關(guān)于數(shù)據(jù)挖掘的。但是本書主要關(guān)注極大規(guī)模數(shù)據(jù)的挖掘,也就是說這些數(shù)據(jù)大到無法在內(nèi)存中存放。由于重點(diǎn)強(qiáng)調(diào)數(shù)據(jù)的規(guī)模,所以本書的例子大都來自Web本身或者Web上導(dǎo)出的數(shù)據(jù)。另外,本書從算法的角度來看待數(shù)據(jù)挖掘,即數(shù)據(jù)挖掘是將算法應(yīng)用于數(shù)據(jù),而不是使用數(shù)據(jù)來“訓(xùn)練”某種類型的機(jī)器學(xué)習(xí)引擎。
小宇宙88888888
學(xué)習(xí)大數(shù)據(jù)的小伙伴在小編看來總共分為兩大類:一是本身就是計(jì)算機(jī)專業(yè)出身,有一定的編程基礎(chǔ),看到大數(shù)據(jù)的就業(yè)前景,想轉(zhuǎn)戰(zhàn)大數(shù)據(jù)行業(yè)的;二是本身不是計(jì)算機(jī)專業(yè)出身,沒有一定的編程基礎(chǔ),依舊想要學(xué)習(xí)大數(shù)據(jù)的。1、沒有編程基礎(chǔ)對于沒有編程基礎(chǔ)的小伙伴,建議你先看一些編程語言的書籍,掌握一門編程語言是必須的,因?yàn)榇髷?shù)據(jù)技術(shù)是由編程語言進(jìn)行開發(fā)的,至少是要掌握一門編程語言的,而且還要有扎實(shí)的基礎(chǔ)。《Head First Java, 2nd Edition(中文版)》這本書不僅內(nèi)容豐富、有趣且通俗易懂,并且涵蓋了所有 Java 相關(guān)的基礎(chǔ)知識(shí)。如果你是 Java 初學(xué)者,這本書正適合你?!禞ava 核心技術(shù)(卷1、2)》寫作風(fēng)格相比 Head First 趣味性來說更顯傳統(tǒng),所涵蓋的內(nèi)容包括 Java 基礎(chǔ)知識(shí)及高級(jí)應(yīng)用,是對于入門來說的另一種選擇?!禞ava 編程思想(第4版)》必讀之作,不僅涵蓋所有 Java 基礎(chǔ),對于編程思想層面的提升也有很好的幫助。2、有一定的編程基礎(chǔ)《為數(shù)據(jù)而生》書中分別闡述在大數(shù)據(jù)、大數(shù)據(jù)和大數(shù)據(jù)時(shí)代下,相對應(yīng)的數(shù)據(jù)分析需要做到分析、外化、集成。《智能時(shí)代》這本書作者分七章從不同角度對大數(shù)據(jù)進(jìn)行介紹,分別以技術(shù)和思維方式的改變?yōu)橹骶€,從工業(yè)革命這個(gè)角度嵌入,順理成章的延伸出大數(shù)據(jù)與智能化,但是沒有將過多筆墨放在技術(shù)的深究上,而是選擇從應(yīng)用層面體現(xiàn)大數(shù)據(jù)的理念。大數(shù)據(jù)應(yīng)用則會(huì)滲透到各行各業(yè),這正是作者的用心之處。《R語言預(yù)測實(shí)戰(zhàn)》R語言橫跨了金融、生物、醫(yī)學(xué)、互聯(lián)網(wǎng)等多個(gè)領(lǐng)域,主要用于統(tǒng)計(jì)、建模及可視化。由于上手快、效率高,備受技術(shù)人員青睞。預(yù)測是大數(shù)據(jù)挖掘的主要作用之一,借助R語言來做大數(shù)據(jù)預(yù)測,可以兼具效率與價(jià)值于一身?!稊?shù)據(jù)之巔》這本書中,從小數(shù)據(jù)時(shí)代到大數(shù)據(jù)的崛起,作者以宏大的歷史觀、文化觀、大數(shù)據(jù)觀,給我們描繪了一幅數(shù)據(jù)科學(xué)、智慧文化的全景圖。《Hadoop權(quán)威指南》《Hadoop權(quán)威指南(中文版)》從Hadoop的緣起開始,由淺入深,結(jié)合理論和實(shí)踐,全方位地介紹Hadoop這一高性能處理海量數(shù)據(jù)集的理想工具?!禜ive編程指南》《Hive編程指南》是一本Apache Hive的編程指南,旨在介紹如何使用Hive的SQL方法HiveQL來匯總、查詢和分析存儲(chǔ)在Hadoop分布式文件系統(tǒng)上的大數(shù)據(jù)集合。以上就是大數(shù)據(jù)學(xué)習(xí)書籍推薦,想要學(xué)習(xí)大數(shù)據(jù)的小伙伴可以酌情參考了!
Oo煉獄天使oO
首先從最基礎(chǔ)的開化,編程,java入門,linux入門,mysql等課程的入門到精通的學(xué)習(xí),然后下一步在開始大數(shù)據(jù)的學(xué)習(xí)。北京大 講臺(tái)大數(shù)據(jù)培訓(xùn)從最基礎(chǔ)的java,linux,mysql開始學(xué)習(xí),zhuce就可以在線聽課了。
黃寶寶0328
在人人高呼的大數(shù)據(jù)時(shí)代,你是想繼續(xù)做一個(gè)月薪6K+的碼農(nóng),還是想要翻身學(xué)習(xí)成為炙手可熱名企瘋搶的大數(shù)據(jù)工程師呢?
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,大數(shù)據(jù)行業(yè)前景非常被看好,有很多朋友對大數(shù)據(jù)行業(yè)心向往之,卻苦于不知道該如何下手,或者說學(xué)習(xí)大數(shù)據(jù)不知道應(yīng)該看些什么書。作為一個(gè)零基礎(chǔ)大數(shù)據(jù)入門學(xué)習(xí)者該看哪些書?今天就給大家分享幾本那些不容錯(cuò)過的大數(shù)據(jù)書籍。
這是一本關(guān)于數(shù)據(jù)挖掘領(lǐng)域的綜合概述,本書前版曾被KDnuggets的讀者評(píng)選為最受歡迎的數(shù)據(jù)挖掘?qū)V且槐究勺x性極佳的教材。它從數(shù)據(jù)庫角度全面系統(tǒng)地介紹數(shù)據(jù)挖掘的概念、方法和技術(shù)以及技術(shù)研究進(jìn)展,并重點(diǎn)關(guān)注近年來該領(lǐng)域重要和最新的課題——數(shù)據(jù)倉庫和數(shù)據(jù)立方體技術(shù),流數(shù)據(jù)挖掘,社會(huì)化網(wǎng)絡(luò)挖掘,空間、多媒體和其他復(fù)雜數(shù)據(jù)挖掘。
這是一本在大數(shù)據(jù)的背景下,描述關(guān)于數(shù)據(jù)建模,數(shù)據(jù)層,數(shù)據(jù)處理需求分析以及數(shù)據(jù)架構(gòu)和存儲(chǔ)實(shí)現(xiàn)問題的書。這本書提供了令人耳目一新的全面解決方案。但不可忽略的是,它也引入了大多數(shù)開發(fā)者并不熟悉的、困擾傳統(tǒng)架構(gòu)的復(fù)雜性問題。本書將教你充分利用集群硬件優(yōu)勢的Lambda架構(gòu),以及專門用來捕獲和分析網(wǎng)絡(luò)規(guī)模數(shù)據(jù)的新工具,來創(chuàng)建這些系統(tǒng)。
這是一本書是關(guān)于數(shù)據(jù)挖掘的。但是本書主要關(guān)注極大規(guī)模數(shù)據(jù)的挖掘,也就是說這些數(shù)據(jù)大到無法在內(nèi)存中存放。由于重點(diǎn)強(qiáng)調(diào)數(shù)據(jù)的規(guī)模,所以本書的例子大都來自Web本身或者Web上導(dǎo)出的數(shù)據(jù)。另外,本書從算法的角度來看待數(shù)據(jù)挖掘,即數(shù)據(jù)挖掘是將算法應(yīng)用于數(shù)據(jù),而不是使用數(shù)據(jù)來“訓(xùn)練”某種類型的機(jī)器學(xué)習(xí)引擎。
queenwendy
《大數(shù)據(jù)處理之道》作者:何金池分析比較了當(dāng)下流行的大數(shù)據(jù)處理技術(shù)的優(yōu)劣及適用場景,包括Hadoop、Spark、Storm、Dremel、Drill等,詳細(xì)分析了各種技術(shù)的應(yīng)用場景和優(yōu)缺點(diǎn);同時(shí)闡述了大數(shù)據(jù)下的日志分析系統(tǒng),重點(diǎn)講解了ELK日志處理方案;最后分析了大數(shù)據(jù)處理技術(shù)的發(fā)展趨勢,重點(diǎn)從各種技術(shù)的起源、設(shè)計(jì)思想、架構(gòu)等方面闡述大數(shù)據(jù)處理之道。
優(yōu)質(zhì)工程師考試問答知識(shí)庫