GEDCOM
GEDCOM (výslovnost [ˈdʒɛdkɒm])(akronym z anglického GEnealogical Data COMmunication) je souborový formát pro výměnu genealogických dat mezi genealogickými programy vyvinutý Církví Ježíše Krista Svatých posledních dnů (známější jako „mormoni“).[1] Soubory GEDCOM jsou čistě textové (obvykle v kódování znaků UTF-8 nebo ASCII) a obsahují genealogické informace o individuálních osobách a metadata, která propojují tyto záznamy navzájem. Většina genealogických programů podporuje import do nebo export z formátu GEDCOM. [2]
Struktura souboru GEDCOM
Soubor GEDCOM obsahuje záhlaví (header), sekci záznamů (records), a koncový záznam (trailer). Záznamy reprezentují individuální osoby (INDI), rodiny (FAM), zdroje informací (SOUR), a další informace, včetně poznámek. Záznamy se skládají z řádků. Každý řádek začíná číslem úrovně. Záznamy nejvyšší úrovně (HEAD, TRLR, SUBN, a každý INDI, FAM, OBJE, NOTE, REPO, SOUR, a SUBM) začínají řádkem s číslem úrovně 0.
Soubor GEDCOM lze vytvářet a upravovat ručně pomocí textového editoru, ale protože byl tento formát navržen pro počítačové zpracování, nejsou tyto úpravy uživatelský přívětivé. Pro ověření správnosti zápisu ve formátu GEDCOM může být použit GEDCOM validátor, např. PhpGedView.
Podpora akcí a zdrojů zahrnující více osob
Soubor GEDCOM může obsahovat informace o událostech, jako jsou narození, úmrtí, záznamy o sčítání lidu, záznamy o manželství, atd. Událost je něco, co se stalo v určitém čase, na konkrétním místě (i když čas a místo nejsou známy). Soubory GEDCOM mohou také obsahovat atributy, jako je fyzický popis, zaměstnání a celkový počet dětí; na rozdíl od událostí nelze atributy obecně spojovat s konkrétním časem nebo místem.
Ve specifikaci GEDCOM jsou události spojené s rodinou, jako jsou informace o manželství, uloženy v GEDCOMu pouze jednou, jako součást rodinného záznamu (FAM), a poté jsou oba manželé propojeni s tímto jediným rodinným záznamem. [3]
Verze
Aktuální verze specifikace GEDCOM 5.5 byla vydána 12. ledna 1996.[4] Návrh specifikace GEDCOM 5.5.1 vydaný v roce 1999, přidal devět nových tagů, (mj. WWW, EMAIL a FACT), a přidal UTF-8 jako povolené kódování znaků. Přestože tento návrh nebyl formálně uznán, tato rozšíření se v mnoha genealogických programech používají. 6. prosince 2002 byla zveřejněna beta verze specifikace GEDCOM 6.0, která používá pro ukládání dat XML formát a podporuje zapisování znaků v kódu Unicode, to umožňuje například zápis východoasijských jmen originálními znaky, bez nejednoznačností daných přepisem znaků, je tedy využitelné pro celosvětový genealogický výzkum.[5]
Omezení
Specifikace GEDCOM vyžaduje, aby každá událost nebo atribut byl propojený s přesně jedním jednotlivcem nebo rodinou. [6] To způsobuje vícenásobné uvedení u událostí, jako jsou záznamy o sčítání, kde záznam často obsahuje informace o více jednotlivcích. V souboru GEDCOM musí být pro sčítání lidu přidána samostatná událost sčítání "CENS" pro každého odkazovaného jednotlivce. Některé genealogické programy, jako například Gramps, používají databázové struktury pro zdroje, které zahrnují události společné pro více osob. Při exportu z podobných programů do formátu GEDCOM, musí být tyto informace duplikovány na každém místě, kde jsou použity, to ztěžuje uživateli udržování aktuálních informací souvisejících se zdroji.
Není jednoznačně určeno, ke kterému záznamu přiřadit událost, tak může být např. záznam s detaily o osvojení potomků uveden u potomků, adoptivních rodičů nebo skutečných rodičů.
GEDCOM nepodporuje specifickou reprezentaci dat mnoha typů blízkých mezilidských vztahů, jako jsou manželství osob stejného pohlaví, domácí partnerství, soužití, polyamorie nebo polygamie. Takové vztahy lze reprezentovat pouze pomocí generické značky ASSO používané pro jakýkoli typ vztahu.
Specifikace GEDCOM nenabízí explicitní podporu pro udržování známého pořadí událostí. Zejména může dojít ke ztrátě pořadí vztahů (FAMS) pro osobu a pořadí dětí ve vztahu (FAM). V mnoha případech lze posloupnost událostí odvodit z přidružených dat. Ale například v případě, že osoba má dva vztahy, oba s neznámými daty a z popisu je známo jejich pořadí, tak pořadí, ve kterém jsou tyto FAMS zaznamenány v záznamu INDI, bude záviset na exportním programu.
Důsledkem omezení formátu GEDCOM je, že některé genealogické programy, používají vlastní rozšíření formátu, které nejsou vždy přenositelná do jiných genealogických programů.
Poslední návrh formátu GEDCOM je verze 6.0 XML Draft zveřejněná v roce 2001, která nemá kompletní specifikaci a není doporučena pro implementování do software. [7]
Příklad
sample.ged | |
0 HEAD 1 SOUR Reunion 2 VERS V8.0 2 CORP Leister Productions 1 DEST Reunion 1 DATE 11 FEB 2006 1 FILE test 1 GEDC 2 VERS 5.5 1 CHAR MACINTOSH 0 @I1@ INDI 1 NAME Bob /Cox/ 1 SEX M 1 FAMS @F1@ 1 CHAN 2 DATE 11 FEB 2006 0 @I2@ INDI 1 NAME Joann /Para/ 1 SEX F 1 FAMS @F1@ 1 CHAN 2 DATE 11 FEB 2006 0 @I3@ INDI 1 NAME Bobby Jo /Cox/ 1 SEX M 1 FAMC @F1@ 1 CHAN 2 DATE 11 FEB 2006 0 @F1@ FAM 1 HUSB @I1@ 1 WIFE @I2@ 1 MARR 1 CHIL @I3@ 0 TRLR |
Následuje výpis jednoduchého souboru GEDCOM.
Hlavička (začínající řádkem HEAD) obsahuje zdrojový program a verzi (Reunion, V8.0), verzi standardu GEDCOM (5.5) a kódování znaků (MACINTOSH).
Individuální záznamy (začínající řádkem INDI) definují osoby Bob Cox (ID 1, resp. @I1@), Joan Para (ID 2) a Bobby Jo Cox (ID 3).
Záznam rodiny (FAM) dává do vztahu manžela (HUSB), manželku (WIFE), a děti (CHIL) podle jejich ID (identifikačního záznamu).
Reference
- ↑ Subject: rep: T Jenkins - open letter to GEDCOM-L - "The goal was to try and provide a standard to allow developers to provide a vehicle for their users to share genealogical conclusions and supporting evidence with others." From: "Jed R. Allen" Brigham Young University - Date: 29 Sep 1995 17:40:04 -0600 - GEDCOM-L Archives -- September 1995, week 5 (#7)
- ↑ Genealogical Software Report Card [online]. March 2005. Dostupné v archivu pořízeném z originálu dne 2009-02-11. (anglicky)
- ↑ GEDCOM Standard 5.5, pp. 26-27.
- ↑ The GEDCOM Standard Release 5.5: Table of Contents. homepages.rootsweb.com [online]. [cit. 2021-04-17]. Dostupné online.
- ↑ Personal Ancestral File 5.2 and PAF Companion 5.4 - Software Version Changes Archivováno 6. 3. 2009 na Wayback Machine Release 5.0.1.4, 22 December 2000 - "10.GEDCOM improvements: Table:Destination:PAF 5 GEDCOM Version:5.5 Character Set:UTF-8
- ↑ GEDCOM Standard 5.5, pp. 26-27.
- ↑ GEDCOM XML Specification Release 6.0 Draft [online]. The Church of Jesus Christ of Latter-day Saints, December 28, 2001 [cit. 2021-04-17]. Dostupné v archivu pořízeném z originálu dne 2006-11-16.
Související články
Externí odkazy
- FamilySearch.org Genealogická stránka provozovaná mormony, která obsahuje informace o GEDCOMu včetně návrhu GEDCOM XML 6.0
- Specifikace formátu GEDCOM jsou dokumentovány na stránkách FamilySearch (hledání rodinných příslušníků):
- GEDCOM 5.5 Standard (spustitelný soubor ve formátu ENVOY)
- Draft Specification for GEDCOM XML 6.0 (PDF)
- GEDCOM 5.5 specification (Paul McBride's HTML version)
- Overview of GEDCOM and its uses na Genealogické encyklopedii
- Okomentovaný příklad souboru GEDCOM
- Cyndi's List — GEDCOM
- Projekt Microsoftu, převod GEDCOM do XML
- GEDCOM TestBook Project
- The GENTECH Genealogical Data Model
- On LDS Church's Adoption of the XML Standard
- Některé genealogické programy
- https://www.ancestris.org/ Ancestris (svobodný software)
- http://www.bkwin.org/ Brother's Keeper
- http://www.heritio.com/ Heritio (dříve Rodokmen Pro)
- http://legacy.unas.cz/ Archivováno 20. 4. 2009 na Wayback Machine Legacy Family Tree
- http://www.myheritage.cz/ MyHeritage
- http://www.ahnenblatt.de/ Ahnenblatt
- http://www.geni.com – projekt, který se snaží vytvořit jeden rodokmen pro celý svět
- http://www.familytreemaker.com/ Family Tree Maker