一、高性能計算與分布式數(shù)據(jù)庫的區(qū)別
高性能計算
高性能計算(HPC,High-Performance Computing)是計算機科學(xué)的一個分支,研究集群架構(gòu)、并行算法和相關(guān)軟件基礎(chǔ),通過分布式計算實現(xiàn)單臺計算機無法達到的運算速度。
高性能計算主要應(yīng)用領(lǐng)域有:
大規(guī)模科學(xué)問題,通過有限元方法應(yīng)用解決如力學(xué)、氣動、熱力學(xué)等工程問題,以及天氣預(yù)報、地形分析和生物制藥等;存儲和處理海量數(shù)據(jù),數(shù)據(jù)挖掘、圖象處理和基因測序等;提供高響應(yīng)效率的并行處理系統(tǒng)等;高性能集群就是采用集群技術(shù)來實現(xiàn)高性能計算,在有限的時間范圍內(nèi)對問題求解。
分布式數(shù)據(jù)庫
分布式系統(tǒng)是由一組通過網(wǎng)絡(luò)進行通信、為了完成共同的任務(wù)而協(xié)調(diào)工作的計算機節(jié)點組成的系統(tǒng)。分布式系統(tǒng)的出現(xiàn)是為了用廉價的、普通的機器完成單個計算機無法完成的計算、存儲任務(wù)。其目的是利用更多的機器,處理更多的數(shù)據(jù)。
分布式數(shù)據(jù)庫系統(tǒng)是在冀中是數(shù)據(jù)庫系統(tǒng)的基礎(chǔ)上發(fā)展來的,比較分布式數(shù)據(jù)庫系統(tǒng)與集中式數(shù)據(jù)庫系統(tǒng),可以發(fā)現(xiàn)分布是數(shù)據(jù)庫系統(tǒng)具有下列優(yōu)點:
(1)更適合分布式的管理與控制。分布式數(shù)據(jù)庫系統(tǒng)的結(jié)構(gòu)更適合具有地理分布特性的組織或機構(gòu)使用,允許分布在不同區(qū)域、不同級別的各個部門對其自身的數(shù)據(jù)實行局部控制。例如:實現(xiàn)全局數(shù)據(jù)在本地錄入、查詢、維護,這時由于計算機資源靠近用戶,可以降低通信代價,提高響應(yīng)速度,而涉及其他場地數(shù)據(jù)庫中的數(shù)據(jù)只是少量的,從而可以大大減少網(wǎng)絡(luò)上的信息傳輸量;同時,局部數(shù)據(jù)的安全性也可以做得更好。
(2)具有靈活的體系結(jié)構(gòu)。集中式數(shù)據(jù)庫系統(tǒng)強調(diào)的是集中式控制,物理數(shù)據(jù)庫是存放在一個場地上的,由一個DBMS集中管理。多個用戶只可以通過近程或遠程終端在多用戶操作系統(tǒng)支持下運行該DBMS來共享集中是數(shù)據(jù)庫中的數(shù)據(jù)。而分布式數(shù)據(jù)庫系統(tǒng)的場地局部DBMS的自治性,使得大部分的局部事務(wù)管理和控制都能就地解決,只有在涉及其他場地的數(shù)據(jù)時才需要通過網(wǎng)絡(luò)作為全局事務(wù)來管理。分布式DBMS可以設(shè)計成具有不同程度的自治性,從具有充分的場地自治到幾乎是完全集中式的控制。
(3)系統(tǒng)經(jīng)濟,可靠性高,可用性好。與一個大型計算機支持一個大型的冀中是數(shù)據(jù)庫在加一些進程和遠程終端相比,由超級微型計算機或超級小型計算機支持的分布式數(shù)據(jù)庫系統(tǒng)往往具有更高的性價比和實施靈活性。分布式系統(tǒng)比集中式系統(tǒng)具有更高的可靠性和更好的可用性。如由于數(shù)據(jù)分布在多個場地并有許多復(fù)制數(shù)據(jù),在個別場地或個別通信鏈路發(fā)生故障時,不致于導(dǎo)致整個系統(tǒng)的崩潰,而且系統(tǒng)的局部故障不會引起全局失控。
(4)在一定條件下響應(yīng)速度加快。如果存取的數(shù)據(jù)在本地數(shù)據(jù)庫中,那末就可以由用戶所在的計算機來執(zhí)行,速度就快。
(5)可擴展性好,易于集成現(xiàn)有系統(tǒng),也易于擴充。
對于一個企業(yè)或組織,可以采用分布式數(shù)據(jù)庫技術(shù)在以建立的若干數(shù)據(jù)庫的基礎(chǔ)上開發(fā)全局應(yīng)用,對原有的局部數(shù)據(jù)庫系統(tǒng)作某些改動,形成一個分布式系統(tǒng)。這比重建一個大型數(shù)據(jù)庫系統(tǒng)要簡單,既省時間,又省財力、物力。也可以通過增加場地數(shù)的辦法,迅速擴充已有的分布式數(shù)據(jù)庫系統(tǒng)。
延伸閱讀:
二、NoSQL數(shù)據(jù)庫在大數(shù)據(jù)時代的優(yōu)勢
NoSQL數(shù)據(jù)庫在大數(shù)據(jù)時代有著巨大的優(yōu)勢。NoSQL數(shù)據(jù)庫一直以性能、可擴展性、靈活的模式和分析能力聚焦著人們的注意力。盡管關(guān)系型數(shù)據(jù)庫對于某些用例來說仍是一個不錯的選擇,就像結(jié)構(gòu)數(shù)據(jù)和要求ACID事務(wù)的應(yīng)用。
1、存儲的數(shù)據(jù)實質(zhì)上是半結(jié)構(gòu)化或者松散的;
2、要求一定的等級的性能和擴展性;
3、存取該數(shù)據(jù)的應(yīng)用與最終的一致性相吻合;
4、靈活的模式;
5、無共享架構(gòu);
6、分片作為數(shù)據(jù)存儲模型的一部分;
7、異步復(fù)制;
8、使用BASE替代ACID事務(wù)。