1樓:微策略中國
如何選擇資料庫
一般來講,資料分析的查詢不會直接從生產環境的資料庫來讀取資料,一方面是影響線上效能,另一方面是oltp的表結構設計更多的是面向插入,而不是讀取。如何來選擇合適的資料庫做資料分析呢?本文給出了四方面的考量,拋磚引玉。
1. 客戶要分析什麼樣的資料
2. 客戶分析的資料量是多少
3. 客戶工程師團隊技術背景,運維能力
4. 預期的資料分析的響應時間
客戶要分析什麼樣的資料
上文已簡單介紹了關係型資料庫和非關係型資料庫的區別,這裡就不再贅述。下圖是乙個簡單的分類。
客戶分析的資料量是多少
使用者需要分析的資料量越大,就越應該考慮非關係型資料庫。
上圖給出了選擇合適資料庫的思路。不同的資料庫處理資料的能力不同。如果你打算處理1t以下的資料,那麼可以使用postgres或者mysql,但如果資料量增大到5t以上,需要在擴充套件性方面下些功夫。
當然,各個資料庫廠商也在不斷的優化效能,像微策略這樣的bi平台也在緊跟各個廠商的步伐,對各個資料庫的特性進行深入的研究,把資料庫新特性運用到bi產品中,給客戶深入分析各個資料庫的優勢劣勢, 確保為客戶提供最大的投入產出比。
客戶工程師團隊技術背景,運維能力
客戶需要了解自己技術團隊的人員結構、技術偏好。如果有強大的技術團隊,關係型和非關係型資料庫都可選擇。一般來講,非關係型資料庫需要更多管理維護的時間。
如果沒有足夠的運維人員,可以選擇像postgres, google sql (a hosted mysql option) 或者 segment warehouses (a hosted redshift) 這樣的資料庫,要優於redshift, aurora or bigquery等。如果運維人員充足,可以選擇redshift等,為以後強大的擴充套件性做好準備。從另乙個角度來說,分析半結構化資料是也是比較普遍的需求。
這樣就對資料科學家的技能提出了更大的挑戰。物件導向的程式設計背景,精通python/r 等語言也是對客戶工程師團隊的重要考量。
預期的資料分析的響應時間
比如像欺詐檢測、系統監控等實時資料分析需要的資料分析相應時間有嚴格的要求。其他的資料分析比如像電子商務**的使用者留存分析等,並沒有實時響應的嚴格要求。客戶需要結合自己的使用者場景,來選擇合適的資料倉儲。
如果絕大部分的分析是基於已有的資料,對資料的實時性沒有特別高的要求,建議使用者選擇像redshift or bigquery這樣的資料庫,對資料的讀取和合併做了大量的優化。如果客戶對實時性要求非常高,可以考慮非結構化的資料庫方向和記憶體資料庫方向。
當然,選擇用什麼樣的資料庫做資料倉儲,只是第一步。以實時分析為例,需要從資料倉儲,資料湖,計算引擎等架構方面做出通盤的考慮。
2樓:匿名使用者
商業oracle,微軟sqlserver,免費mysql不過還得看看需求吧,資料庫不是程式語言不能用哪個更好來區分,主要是看你平時的工作需求,規模大小,還有就是應用場景。。
不過如果是新手的話可以從雲資料庫網頁鏈結開始了解,可根據不同場景不同需求搭建應用一下有乙個最起碼的認識。
相對於傳統的資料庫搭建,雲資料庫有乙個後台控制面板,通過控制面板實時見監控運算元據庫,等於省了乙個運維人員,而且後台的操作簡潔易用,學習成本比較低。那它來入門最好不過了。
3樓:幕貫徹落實匣
常用的資料庫一般是分為三種: (一)、access (二)sql server (三)mysql, access是一種桌面資料庫,只適合資料量少的應用,在處理少量資料和單機訪問的資料庫時是很好的,效率也很高。但是它的同時訪問客戶端不能多於4個。
access資料庫有一定的...
如何選擇資料庫?
4樓:嫭兏鍯
mysql:如果**基於php開發,則適合使用mysql。如果您的虛擬主機採用linux作為作業系統(即linux虛擬主機),一般也採用mysql。
mysql具有很高的效率,勝任大中小各種型別的**應用。搭配phpmyadmin,使用者通過瀏覽器即可方便的管理資料庫。
sqlserver/access:
如果**是基於asp或asp.net開發,一般使用微軟的access或sqlserver(即mssql)。其中access是文字資料庫,其查詢或儲存效率遠低於sqlserver,不宜作為大型應用的選擇,通常適用於小型**。
而sqlserver需要伺服器安裝專門的sqlserver程式,效率較高,並且有專業的管理客戶端。
通常情況下,各類**程式都會指定所需要的環境,例如discuz、phpwind、shopex預設使用mysql,而discuz!nt、動易、dvbbs等預設使用access或sqlserver.
華夏名網是業界最先提供g級資料庫容量的主機提供商,除了高容量,還提供超強的一鍵備份、恢復功能,具有
超高價效比!
如何選擇資料庫?
5樓:匿名使用者
商業oracle,微軟sqlserver,免費mysql
不過還得看看需求吧,資料庫不是程式語言不能用哪個更好來區分,主要是看你平時的工作需求,規模大小,還有就是應用場景。。
不過如果是新手的話可以從雲資料庫網頁鏈結開始了解,可根據不同場景不同需求搭建應用一下有乙個最起碼的認識。
6樓:
1、我認為你個需求:mysql、sqlserver...都可以完成。
2、如果經濟上充足:oracle、db2隨你選。
3、如果是我會選擇搭建資料庫集群,採用20個mysql實現這個需求。(難度相當高,你懂得。)
informix資料庫如何建立資料庫,建立資料庫表,建立索引
為t kc表的cname欄位建立索引。最後當然主鍵當然是sid了 一定要標好哦 informix第乙個真正支援sql語言的關聯式資料庫產品是informix se standardengine 1 有輸入輸出 create procedure pnormalparam f1 integer,f2 v...
選擇衛星遙感資料?如何選,如何選擇合適的遙感資料進行研究?
看你研究的內容需要多高解析度的影像,如果研究河流地貌,農作物生長這樣的,普通的tm etm資料都可以,就是landsat系列,如果需要高達幾公尺的解析度,則需要中巴衛星 快鳥之類的衛星資料,高解析度一般都要花錢的。看你是否需要多波段,tm etm一般都是7 8個波段,如果需要多波段資料,就要選擇mo...
如何修改資料庫連線檔案,如何修改資料庫連線檔案data common inc php
cfg dbhost localhost 這個是主機名,一般情況下不用修改,也可以填寫為你的主機ip cfg dbname web1 這個是資料庫名字 cfg dbuser root 資料庫登陸賬號 cfg dbpwd root 賬號密碼 cfg dbprefix dede 資料庫表字首 cfg d...