Import souboru GEDCOM z MyHeritage (Family Tree Builder)

Jak importovat a exportovat informace.
Uživatelský avatar
michal
Příspěvky: 731
Registrován: 06 čer 2013 21:37
Bydliště: Hostinné
Kontaktovat uživatele:

Import souboru GEDCOM z MyHeritage (Family Tree Builder)

Příspěvekod michal » 15 dub 2014 11:29

Soubor GEDCOM vytvořený z programů MyHeritage a Family Tree Builder je vždy v kódování UTF-8. Program Legacy Family Tree zobrazuje data v kódování Windows (CP-1250).

Soubor GEDCOM vytvořený z MyHeritage je proto třeba před jeho importem do Legacy překódovat z UTF-8 do CP-1250. Avšak funkce export do souboru GEDCOM funguje v programech MyHeritage a Family Tree Builder co se týče kódování výsledného souboru do určité míry nestandardně. Pokud totiž výsledný soubor GEDCOM obsahuje zdroje a citace (ve Family Tree Builderu jste zaškrtli volbu "Uložit zdroje a citace" nebo v MyHeritage exportované údaje obsahují zdroje a citace), programátoři MyHeritage rozdělují textové řetězce po 200 bytech, ne po 200 znacích. Pokud se znak s diakritikou ocitne na konci těchto 200 bytů, nastane problém. Vznikne nesmyslná posloupnost bytů a chybný UTF-8 soubor.

U takového souboru GEDCOM nelze použít pro změnu kódování běžně používaný editor PSPad. Překódování z UTF-8 do CP-1250 lze v tomto případě provést např. pomocí textového editoru Poznámkový blok (Notepad). Vyexportovaný soubor GEDCOM otevřete v Poznámkovém bloku, dejte Uložit jako a v políčku Kódování vyberte ANSI místo nabízeného UTF-8. Soubor následně uložte pod jiným názvem. Pokud je soubor GEDCOM příliš velký a nelze jej otevřít v Poznámkovém bloku, je možné pro překódování použít program Notepad++ (http://notepad-plus-plus.org/).

Překódování pomocí Poznámkového bloku či Notepad ++ dopadne celkově sice úspěšně, ale na místo znaku s diakritikou, který se nacházel na konci 200 bytů, bude doplněn jiný, nesmyslný znak.
Jedná se tedy o chybu programátorů MyHeritage, nikoli Legacy Family Tree.

Postup změny kódování pomocí editoru Notepad++
Soubor GEDCOM vytvořený z MyHeritage nebo Family Tree Builder otevřeme v editoru Notepad++ a poté zvolíme Formát a v zobrazeném menu klikneme na Konvertovat do ANSI.

Obrázek

Poté zvolíme Soubor>Uložit.

Pro konverzi těchto souborů GEDCOM z UTF-8 do CP1250 lze využít i např. online konvertor. Jako kódovou stránku vstupního souboru zadáte utf-8 a jako kódovou stránku výstupního souboru zvolíte windows-1250.

Závěr tohoto příspěvku tedy zní:
Při převodu dat z FTB do Legacy může (nikoli nutně musí) nastat situace, kdy v textu některých pramenů bude v Legacy poškozená čeština.

Zpět na “Import a export”

Kdo je online

Uživatelé prohlížející si toto fórum: Žádní registrovaní uživatelé a 1 host