Kľúč kandidáta je kombinácia atribútov, ktoré jedinečne identifikujú databázový záznam bez odkazu na akékoľvek iné údaje. Každá tabuľka môže mať jedného alebo viacerých kandidátov. Jeden z týchto kandidátskych kľúčov sa vyberie ako primárny kľúč tabuľky. Tabuľka obsahuje iba jeden primárny kľúč, ale môže obsahovať niekoľko kandidátskych kľúčov. Ak sa kandidátsky kľúč skladá z dvoch alebo viacerých stĺpcov, nazýva sa zložený kľúč.
Vlastnosti kandidátskeho kľúča
Všetky kandidátske kľúče majú niektoré spoločné vlastnosti. Jednou z vlastností je, že počas životnosti kandidátskeho kľúča musí atribút použitý na identifikáciu zostať rovnaký. Ďalším je, že hodnota nemôže byť nulová. Napokon, kandidátsky kľúč musí byť jedinečný.
Na špecifickú a jedinečnú identifikáciu každého zamestnanca môže spoločnosť napríklad použiť číslo sociálneho poistenia zamestnanca. Niektorí ľudia zdieľajú rovnaké krstné mená, priezviská a pozície, ale žiadni dvaja ľudia nepoužívajú rovnaké číslo sociálneho poistenia.
Číslo sociálneho poistenia | Krstné meno | Priezvisko | Pozícia |
---|---|---|---|
123-45-6780 | Craig | Jones | Manažér |
234-56-7890 | Craig | Beal | Spolupracovník |
345-67-8900 | Sandra | Beal | Manažér |
456-78-9010 | Trina | Jones | Spolupracovník |
567-89-0120 | Sandra | Smith | Spolupracovník |
Príklady kandidátskych kľúčov
Niektoré typy údajov sa ľahko hodia ako kandidáti:
- Medzinárodné štandardné čísla kníh: Kódy ISBN jedinečne identifikujú knihy a súvisiace médiá. Vydávanie čísel ISBN je prísne regulované správcami odvetvia a vydavatelia nikdy znovu nepoužívajú čísla ISBN.
- Čísla bankových účtov: Väčšina bánk čísla účtov nerecykluje.
- Sériové čísla: Hoci sa sériové čísla neriadia v rôznych odvetviach, v kontexte jedného dodávateľa by sériové číslo malo byť vždy jedinečné.
- Čísla vodičského preukazu: Tieto čísla zvyčajne nie sú duplicitné. Osoba, ktorá sa sťahuje zo štátu do štátu, však môže mať viac ako jedno číslo DL.
- ID národného poskytovateľa: Lekári a iní licencovaní poskytovatelia zdravotnej starostlivosti majú každý aspoň jeden NPI, ktorý je pre nich jedinečný a ktorý vydalo Ministerstvo zdravotníctva a sociálnych služieb USA.
Niektoré typy informácií, ktoré sa môžu zdať ako dobrí kandidáti, sa však v skutočnosti ukážu ako problematické:
- Telefónne čísla: Väčšina operátorov recykluje telefónne čísla a jednotliví predplatitelia môžu používať niekoľko telefónnych čísel súčasne.
- Univerzálne cenové kódy: UPC sú jedinečné, ale vlastník bloku UPC môže produkty ľubovoľne recyklovať.
- Čísla zdravotných záznamov: MRN sa vo všeobecnosti vydávajú na nemocničnej úrovni, bez akéhokoľvek národného usmernenia o štruktúre a formáte týchto identifikátorov.
- Čísla sociálneho zabezpečenia: Hoci sú teoreticky jedinečné, SSN sa recyklujú a podvody s SSN sú natoľko bežné, že tento identifikátor je problematický pri veľkých súboroch údajov. (V kontexte zamestnávateľa, ktorý overuje SSN, táto výzva nepredstavuje problém.)