免費的數(shù)據(jù)分析工具(數(shù)據(jù)分析軟件平臺)
我推薦一些常用的大數(shù)據(jù)分析工具
1.專業(yè)的大數(shù)據(jù)分析工具
2.各種Python數(shù)據(jù)可視化第三方庫
3.其它語言的數(shù)據(jù)可視化框架
一、專業(yè)的大數(shù)據(jù)分析工具
1、FineReport
FineReport是一款純Java編寫的、集數(shù)據(jù)展示(報表)和數(shù)據(jù)錄入(表單)功能于一身的企業(yè)級web報表工具,只需要簡單的拖拽操作便可以設計復雜的中國式報表,搭建數(shù)據(jù)決策分析系統(tǒng)。
2、FineBI
FineBI是新一代自助大數(shù)據(jù)分析的商業(yè)智能產(chǎn)品,提供了從數(shù)據(jù)準備、自助數(shù)據(jù)處理、數(shù)據(jù)分析與挖掘、數(shù)據(jù)可視化于一體的完整解決方案,也是我比較推崇的可視化工具之一。
FineBI的使用感同Tableau類似,都主張可視化的探索性分析,有點像加強版的數(shù)據(jù)透視表。上手簡單,可視化庫豐富??梢猿洚敂?shù)據(jù)報表的門戶,也可以充當各業(yè)務分析的平臺。
二、Python的數(shù)據(jù)可視化第三方庫
Python正慢慢地成為數(shù)據(jù)分析、數(shù)據(jù)挖掘領域的主流語言之一。在Python的生態(tài)里,很多開發(fā)者們提供了非常豐富的、用于各種場景的數(shù)據(jù)可視化第三方庫。這些第三方庫可以讓我們結合Python語言繪制出漂亮的圖表。
1、pyecharts
Echarts(下面會提到)是一個開源免費的javascript數(shù)據(jù)可視化庫,它讓我們可以輕松地繪制專業(yè)的商業(yè)數(shù)據(jù)圖表。當Python遇上了Echarts,pyecharts便誕生了,它是由chenjiandongx等一群開發(fā)者維護的Echarts Python接口,讓我們可以通過Python語言繪制出各種Echarts圖表。
2、Bokeh
Bokeh是一款基于Python的交互式數(shù)據(jù)可視化工具,它提供了優(yōu)雅簡潔的方法來繪制各種各樣的圖形,可以高性能的可視化大型數(shù)據(jù)集以及流數(shù)據(jù),幫助我們制作交互式圖表、可視化儀表板等。
三、其他數(shù)據(jù)可視化工具
1、Echarts
前面說過了,Echarts是一個開源免費的javascript數(shù)據(jù)可視化庫,它讓我們可以輕松地繪制專業(yè)的商業(yè)數(shù)據(jù)圖表。
大家都知道去年春節(jié)以及近期央視大規(guī)劃報道的百度大數(shù)據(jù)產(chǎn)品,如百度遷徙、百度司南、百度大數(shù)據(jù)預測等等,這些產(chǎn)品的數(shù)據(jù)可視化均是通過ECharts來實現(xiàn)的。
2、D3
D3(Data Driven Documents)是支持SVG渲染的另一種JavaScript庫。但是D3能夠提供大量線性圖和條形圖之外的復雜圖表樣式,例如Voronoi圖、樹形圖、圓形集群和單詞云等。
1、數(shù)據(jù)處理工具:Excel
數(shù)據(jù)分析師,在有些公司也會有數(shù)據(jù)產(chǎn)品經(jīng)理、數(shù)據(jù)挖掘工程師等等。他們最初級最主要的工具就是Excel。有些公司也會涉及到像Visio,Xmind、PPT等設計圖標數(shù)據(jù)分析方面的高級技巧。數(shù)據(jù)分析師是一個需要擁有較強綜合能力的崗位,因此,在有些互聯(lián)網(wǎng)公司仍然需要數(shù)據(jù)透視表演練、Vision跨職能流程圖演練、Xmind項目計劃導圖演練、PPT高級動畫技巧等。
2、數(shù)據(jù)庫:MySQL
Excel如果能夠玩的很轉(zhuǎn),能勝任一部分數(shù)據(jù)量不是很大的公司。但是基于Excel處理數(shù)據(jù)能力有限,如果想勝任中型的互聯(lián)網(wǎng)公司中數(shù)據(jù)分析崗位還是比較困難。因此需要學會數(shù)據(jù)庫技術,一般Mysql。你需要了解MySQL管理工具的使用以及數(shù)據(jù)庫的基本操作;數(shù)據(jù)表的基本操作、MySQL的數(shù)據(jù)類型和運算符、MySQL函數(shù)、查詢語句、存儲過程與函數(shù)、觸發(fā)程序以及視圖等。比較高階的需要學習MySQL的備份和恢復;熟悉完整的MySQL數(shù)據(jù)系統(tǒng)開發(fā)流程。
3、數(shù)據(jù)可視化:Tableau& Echarts
如果說前面2條是數(shù)據(jù)處理的技術,那么在如今“顏值為王”的現(xiàn)在,如何將數(shù)據(jù)展現(xiàn)得更好看,讓別人更愿意看,這也是一個技術活。好比公司領導讓你對某一個項目得研究成果做匯報,那么你不可能給他看單純的數(shù)據(jù)一樣,你需要讓數(shù)據(jù)更直觀,甚至更美觀。
Echarts是開源的,代碼可以自己改,種類也非常豐富,這里不多做介紹,可以去創(chuàng)建一個工作區(qū)了解下。
4、大數(shù)據(jù)分析:SPSS& Python& HiveSQL等
如果說Excel是“輕數(shù)據(jù)處理工具”,Mysql是“中型數(shù)據(jù)處理工具”那么,大數(shù)據(jù)分析,涉及的面就非常廣泛,技術點涉及的也比較多。這也就是為什么目前互聯(lián)網(wǎng)公司年薪百萬重金難求大數(shù)據(jù)分析師的原因。
編者按:數(shù)據(jù)科學家是21世紀的熱門工作。工欲善其事必先利其器。數(shù)據(jù)分析工具何其多,究竟用哪樣才合適?Lewis Chou在Medium上分析了3類6種工具的特點和適用場景,看完這篇文章,相信你就可以知道了。原文標題是:Top 6 Data Analytics Tools in 2019
說到數(shù)據(jù)分析工具,我們總是有疑問。那么多的數(shù)據(jù)分析工具,它們之間究竟有什么區(qū)別?哪個更好?我應該學習哪一個?
盡管這是一個老生常談的話題,但它確實很重要,我一直在努力尋找這個終極問題的答案。如果你到網(wǎng)上搜索這個領域的相關信息的話,很難找到公正的看法。因為特定數(shù)據(jù)分析工具的評估者可能會從不同的角度出發(fā),并帶有一些個人感受。
今天,讓我們撇開這些個人感受。我會嘗試跟大家一起客觀地談談我對市場上數(shù)據(jù)分析工具的個人看法,以供參考。
我總共選擇了三類共6種工具。接下來我會一一進行介紹。
Excel具備多種強大功能,比如創(chuàng)建表單,數(shù)據(jù)透視表,VBA等,Excel的系統(tǒng)如此龐大,以至于沒有任何一項分析工具可以超越它,確保了大家可以根據(jù)自己的需求分析數(shù)據(jù)。
但是,有些人可能以為他們非常精通計算機編程語言,然后鄙視用Excel作為工具,因為Excel無法處理大數(shù)據(jù)。但是請考慮一下,我們?nèi)粘I钪惺褂玫臄?shù)據(jù)是不是超出了大數(shù)據(jù)的限制?在我看來,Excel就是一款全能型的播放器。它最適合小型數(shù)據(jù),而且通過插件還可以處理數(shù)百萬的數(shù)據(jù)。
綜上所述,基于Excel的強大功能及其用戶規(guī)模,我認為它是必不可少的工具。如果你想學習數(shù)據(jù)分析,Excel絕對是首選。
商業(yè)智能是為數(shù)據(jù)分析而生的,它誕生的起點很高。其目的是縮短從商業(yè)數(shù)據(jù)到商業(yè)決策的時間,并利用數(shù)據(jù)來影響決策。
Excel的產(chǎn)品目標不是這樣。Excel可以做很多事情。你可以使用Excel畫課程表,制作問卷或用作計算器,甚至可以用來畫畫。如果你會VBA,還可以制作小型游戲。不過這些并不是真正的數(shù)據(jù)分析功能。
但是BI工具就是專門用于數(shù)據(jù)分析的。
以常見的BI工具(例如Power BI,F(xiàn)ineReport和Tableau)為例。你會發(fā)現(xiàn)它們都是按照數(shù)據(jù)分析流程設計的。先是數(shù)據(jù)處理,數(shù)據(jù)清洗,然后是數(shù)據(jù)建模,最后是數(shù)據(jù)可視化,用圖表來識別問題并影響決策。
這些是數(shù)據(jù)分析的唯一方法,并且在這個過程中存在一些員工的痛點。
比方說,可以用BI工具來簡化重復的低附加值的數(shù)據(jù)清洗工作。
如果數(shù)據(jù)量很大,傳統(tǒng)工具Excel是無法完成數(shù)據(jù)透視表的。
如果我們用Excel來進行圖形顯示,會需要花費大量時間來編輯圖表,包括顏色和字體設置等瑣事。
這些痛點是BI工具可以為我們帶來變化和價值的地方。
現(xiàn)在,讓我們比較一下市場上的三種流行的BI工具:Power BI,F(xiàn)ineReport和Tableau。
1)Tableau
Tableau的核心本質(zhì)實際上是Excel的數(shù)據(jù)透視表和數(shù)據(jù)透視圖??梢哉fTableau敏銳地意識到了Excel的這一功能。它進入BI市場較早,并延續(xù)了這一核心價值。
從發(fā)展歷史和當前市場反饋的角度來看,Tableau的可視化效果更好。我不認為這是因為它的圖表有多酷,但是它的設計、顏色和用戶界面給我們一種簡單而新鮮的感覺。
確實,這就像Tableau自己的宣傳一樣,他們投入了大量的學術精力來研究大家喜歡哪種圖表,以及如何為用戶提供操作和視覺上的終極體驗。
此外,Tableau還增加了數(shù)據(jù)清洗功能和更智能的分析功能。這也是Tableau可以預期的產(chǎn)品開發(fā)優(yōu)勢。
2)Power BI
Power BI的優(yōu)勢在于其業(yè)務模型和數(shù)據(jù)分析功能。
Power BI以前是Excel的插件,但是發(fā)展并不理想。因此它擺脫了Excel,發(fā)展成BI工具。作為后來者,Power BI每個月都有迭代更新,并且跟進的速度很快。
Power BI當前具有三種授權方式:Power BI Free、Power BI Pro以及Power BI Premium。與Tableau一樣,免費版的功能也不完整。但是給個人用幾乎已經(jīng)足夠。而且Power BI的數(shù)據(jù)分析功能強大。它的PowerPivot和DAX語言讓我能夠以類似在Excel中編寫公式的方式來進行復雜的高級分析。
3)FineReport應用
FineReport之所以獨特在于它的自助服務數(shù)據(jù)分析非常適合企業(yè)用戶。只需簡單的拖放操作,你就可以使用FineReport設計各種樣式的報告,并輕松構建數(shù)據(jù)決策分析系統(tǒng)。
FineReport可以直接連接到各種數(shù)據(jù)庫,并且方便快捷地自定義各種樣式,從而制作周報、月報和季報、年報。其格式類似于Excel的界面。功能包括報告創(chuàng)建,報告權限分配,報告管理,數(shù)據(jù)輸入等。
此外,F(xiàn)ineReport的可視化功能也非常突出,它提供了多種儀表板模板和許多自行開發(fā)的可視插件庫。
在價格方面,F(xiàn)ineReport的個人版本是完全免費的,并且所有功能都是開放的。
R和Python是我要討論的第三類工具。盡管像Excel和BI工具這樣的軟件已盡最大努力考慮到數(shù)據(jù)分析的大多數(shù)應用場景,但其實它們基本上都是定制化的。如果軟件沒有設計某項功能或替某功能開發(fā)按鈕,那很可能你就沒法用它們來完成工作。
在這一點上面,編程語言是不一樣的。它非常強大和靈活。你可以編寫代碼來執(zhí)行所需的任何操作。比方說,R和Python是數(shù)據(jù)科學家必不可少的工具。從專業(yè)的角度來看,它們絕對比Excel和BI工具強大。
那么,R和Python可以實現(xiàn)哪些Excel和BI工具難以實現(xiàn)的應用場景呢?
1)專業(yè)統(tǒng)計分析
就R語言而言,它最擅長的是統(tǒng)計分析,例如正態(tài)分布,使用算法對聚類進行分類和回歸分析等。這種分析就像用數(shù)據(jù)作實驗一樣。它可以幫助我們回答以下問題。
比方說,數(shù)據(jù)的分布是正態(tài)分布、三角分布還是其他類型的分布?離散情況如何?它是否在我們想要達到的統(tǒng)計可控范圍內(nèi)?不同參數(shù)對結果的影響的大小是多少?還有假設仿真分析。如果某個參數(shù)發(fā)生變化,會帶來多大影響?
2)獨立預測分析
比方說,我們打算預測消費者的行為。他會在我們的商店停留多長時間?他會花多少錢?我們可以找出他的個人信用情況,并根據(jù)他的在線消費記錄確定貸款金額?;蛘?,我們可以根據(jù)他在網(wǎng)頁上的瀏覽歷史推送不同的物品。這也涉及當前流行的機器學習和人工智能概念。
以上比較說明了幾種軟件之間的區(qū)別。我想概括的要點的是,存在就是合理。Excel,BI工具或編程語言存在部分功能重疊,但它們也是互補的工具。每個應用的價值取決于要開發(fā)的應用的類型和當時的情況。
在選擇數(shù)據(jù)分析工具之前,你必須首先了解自己的工作:你會不會用到我剛剛提到的應用場景?;蚩紤]一下你的職業(yè)方向:你是面向數(shù)據(jù)科學還是業(yè)務分析的。
譯者:boxi。
版權聲明
風口星內(nèi)容全部來自網(wǎng)絡,版權爭議與本站無關,如果您認為侵犯了您的合法權益,請聯(lián)系我們刪除,并向所有持版權者致最深歉意!本站所發(fā)布的一切學習教程、軟件等資料僅限用于學習體驗和研究目的;不得將上述內(nèi)容用于商業(yè)或者非法用途,否則,一切后果請用戶自負。請自覺下載后24小時內(nèi)刪除,如果您喜歡該資料,請支持正版!