數據庫最簡單的實現(xiàn)

所有應用軟件之中带斑，數據庫可能是最復雜的席噩。

MySQL的手冊有3000多頁模捂，PostgreSQL的手冊有2000多頁捶朵，Oracle的手冊更是比它們相加還要厚。

但是狂男，自己寫一個最簡單的數據庫综看，做起來并不難。關鍵在于理解其中的原理

一數據以文本形式保存

第一步岖食，就是將所要保存的數據红碑，寫入文本文件。這個文本文件就是你的數據庫泡垃。
為了方便讀取析珊，數據必須分成記錄，每一條記錄的長度規(guī)定為等長蔑穴。比如忠寻，假定每條記錄的長度是800字節(jié)，那么第5條記錄的開始位置就在3200字節(jié)存和。

大多數時候奕剃，我們不知道某一條記錄在第幾個位置，只知道主鍵（primary key）的值捐腿。這時為了讀取數據纵朋，可以一條條比對記錄。但是這樣做效率太低茄袖，實際應用中操软，數據庫往往采用B樹（B-tree）格式儲存數據。

二什么是B樹

要理解B樹绞佩，必須從二叉查找樹（Binary search tree）講起：

二叉查找樹

二叉查找樹是一種查找效率非常高的數據結構寺鸥，它有三個特點：

（1）每個節(jié)點最多只有兩個子樹。
（2）左子樹都為小于父節(jié)點的值品山，右子樹都為大于父節(jié)點的值胆建。
（3）在n個節(jié)點中找到目標值肘交，一般只需要log(n)次比較笆载。

二叉查找樹的結構不適合數據庫，因為它的查找效率與層數相關。越處在下層的數據，就需要越多次比較。極端情況下咽笼，n個數據需要n次比較才能找到目標值媳纬。對于數據庫來說其监，每進入一層米死，就要從硬盤讀取一次數據物喷，這非常致命，因為硬盤的讀取時間遠遠大于數據處理時間卓练，數據庫讀取硬盤的次數越少越好。

B樹是對二叉查找樹的改進拴测。它的設計思想是务荆，將相關數據盡量集中在一起，以便一次讀取多個數據，減少硬盤操作次數盅惜。

B樹

B樹的特點也有三個井佑。

（1）一個節(jié)點可以容納多個值蝶防。比如上圖中，最多的一個節(jié)點容納了4個值明吩。
（2）除非數據已經填滿间学，否則不會增加新的層。也就是說印荔，B樹追求"層"越少越好低葫。
（3）子節(jié)點中的值，與父節(jié)點中的值仍律，有嚴格的大小對應關系嘿悬。一般來說，如果父節(jié)點有a個值水泉，那么就有a+1個子節(jié)點善涨。比如上圖中，父節(jié)點有兩個值（7和16）草则，就對應三個子節(jié)點钢拧，第一個子節(jié)點都是小于7的值，最后一個子節(jié)點都是大于16的值炕横，中間的子節(jié)點就是7和16之間的值源内。

這種數據結構，非常有利于減少讀取硬盤的次數份殿。假定一個節(jié)點可以容納100個值膜钓，那么3層的B樹可以容納100萬個數據，如果換成二叉查找樹卿嘲，則需要20層呻此！假定操作系統(tǒng)一次讀取一個節(jié)點，并且根節(jié)點保留在內存中腔寡，那么B樹在100萬個數據中查找目標值，只需要讀取兩次硬盤掌唾。

三索引

數據庫以B樹格式儲存放前，只解決了按照"主鍵"查找數據的問題。如果想查找其他字段糯彬，就需要建立索引（index）凭语。

所謂索引，就是以某個字段為關鍵字的B樹文件撩扒。假定有一張"雇員表"似扔，包含了員工號（主鍵）和姓名兩個字段吨些。可以對姓名建立索引文件炒辉，該文件以B樹格式對姓名進行儲存豪墅，每個姓名后面是其在數據庫中的位置（即第幾條記錄）。查找姓名的時候黔寇，先從索引中找到對應第幾條記錄偶器，然后再從表格中讀取。

這種索引查找方法缝裤，叫做"索引順序存取方法"（Indexed Sequential Access Method）屏轰，縮寫為ISAM。它已經有多種實現(xiàn)（比如C-ISAM庫和D-ISAM庫）憋飞，只要使用這些代碼庫霎苗，就能自己寫一個最簡單的數據庫。

四高級功能

部署了最基本的數據存乳蛔觥（包括索引）以后唁盏，還可以實現(xiàn)一些高級功能。

（1）SQL語言是數據庫通用操作語言瘤睹，所以需要一個SQL解析器升敲，將SQL命令解析為對應的ISAM操作。
（2）數據庫連接（join）是指數據庫的兩張表通過"外鍵"轰传，建立連接關系驴党。你需要對這種操作進行優(yōu)化。
（3）數據庫事務（transaction）是指批量進行一系列數據庫操作获茬，只要有一步不成功港庄，整個操作都不成功。所以需要有一個"操作日志"恕曲，以便失敗時對操作進行回滾鹏氧。
（4）備份機制：保存數據庫的副本。
（5）遠程操作：使得用戶可以在不同的機器上佩谣，通過TCP/IP協(xié)議操作數據庫把还。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市茸俭，隨后出現(xiàn)的幾起案子吊履，更是在濱河造成了極大的恐慌，老刑警劉巖调鬓，帶你破解...
沈念sama閱讀 212,542評論 6贊 493
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件艇炎，死亡現(xiàn)場離奇詭異，居然都是意外死亡腾窝，警方通過查閱死者的電腦和手機缀踪，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,596評論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門居砖，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人驴娃，你說我怎么就攤上這事奏候。” “怎么了托慨？”我有些...
開封第一講書人閱讀 158,021評論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵鼻由，是天一觀的道長。經常有香客問我厚棵，道長蕉世，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 56,682評論 1贊 284
?港島之戀（遺憾婚禮）
正文為了忘掉前任婆硬，我火速辦了婚禮狠轻，結果婚禮上，老公的妹妹穿的比我還像新娘彬犯。我一直安慰自己向楼，他們只是感情好，可當我...
茶點故事閱讀 65,792評論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布谐区。她就那樣靜靜地躺著湖蜕，像睡著了一般。火紅的嫁衣襯著肌膚如雪宋列。梳的紋絲不亂的頭發(fā)上昭抒，一...
開封第一講書人閱讀 49,985評論 1贊 291
城市分裂傳說
那天，我揣著相機與錄音炼杖，去河邊找鬼灭返。笑死，一個胖子當著我的面吹牛坤邪，可吹牛的內容都是我干的熙含。我是一名探鬼主播，決...
沈念sama閱讀 39,107評論 3贊 410
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼艇纺，長吁一口氣：“原來是場噩夢啊……” “哼怎静！你這毒婦竟也來了？” 一聲冷哼從身側響起黔衡，我...
開封第一講書人閱讀 37,845評論 0贊 268
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤消约，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后员帮，有當地人在樹林里發(fā)現(xiàn)了一具尸體，經...
沈念sama閱讀 44,299評論 1贊 303
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡导饲，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 36,612評論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年捞高，在試婚紗的時候發(fā)現(xiàn)自己被綠了氯材。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 38,747評論 1贊 341
活死人
序言：一個原本活蹦亂跳的男人離奇死亡硝岗，死狀恐怖氢哮，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情型檀，我是刑警寧澤冗尤，帶...
沈念sama閱讀 34,441評論 4贊 333
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站胀溺，受9級特大地震影響裂七，放射性物質發(fā)生泄漏。R本人自食惡果不足惜仓坞，卻給世界環(huán)境...
茶點故事閱讀 40,072評論 3贊 317
男人毒藥：我在死后第九天來索命
文/蒙蒙一背零、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧无埃，春花似錦徙瓶、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,828評論 0贊 21
一樁弒父案侦镇，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至织阅，卻和暖如春壳繁，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背蒲稳。一陣腳步聲響...
開封第一講書人閱讀 32,069評論 1贊 267
情欲美人皮
我被黑心中介騙來泰國打工氮趋，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人江耀。一個月前我還...
沈念sama閱讀 46,545評論 2贊 362
代替公主和親
正文我出身青樓剩胁，卻偏偏與公主長得像，于是被迫代替她去往敵國和親祥国。傳聞我的和親對象是個殘疾皇子昵观，可洞房花燭夜當晚...
茶點故事閱讀 43,658評論 2贊 350

數據庫最簡單的實現(xiàn)

一 數據以文本形式保存

二 什么是B樹

三 索引

四 高級功能

推薦閱讀更多精彩內容

一數據以文本形式保存

二什么是B樹

三索引

四高級功能