-
HisKi ID
{{ menu.Hiski.selected.xref }}
Name
{{ menu.Hiski.selected.name || "--" }}
Date of baptism
{{ menu.Hiski.selected.data.birth_date_string || "--" }}
Death year
{{ menu.Hiski.selected.data.death_date_year || "--" }}
--
Parish
{{ menu.Hiski.selected.data.location.parish_name || "--" }}
Father name
{{ menu.Hiski.selected.data.dad_first || "--" }} {{ menu.Hiski.selected.data.dad_patronym || ""}} {{ menu.Hiski.selected.data.dad_family || ""}}
Father probabilities
Probability Name Date of baptism Parish
{{ p.prob * 100 | number:4 }} % {{ p.name }} {{ p.birth_date_string }} {{ p.parish }}
Mother name
{{ menu.Hiski.selected.data.mom_first || "--" }} {{ menu.Hiski.selected.data.mom_patronym || ""}} {{ menu.Hiski.selected.data.mom_family || ""}}
Mother probabilities
Probability Name Date of baptism Parish
{{ p.prob * 100 | number:4 }} % {{ p.name }} {{ p.birth_date_string }} {{ p.parish }}
soundex_family
{{ menu.Hiski.selected.data.soundex_family }}
fuzzy index
{{ menu.Hiski.selected.order_fuzzy_index }}
order reason
{{ menu.Hiski.selected.order_reason }}
leftmost_parent
{{ menu.Hiski.selected.leftmost_parent.xref }}
rightmost_parent
{{ menu.Hiski.selected.rightmost_parent.xref }}
rightmost_spouse
{{ menu.Hiski.selected.rightmost_spouse.xref }}
rightmost_subnode
{{ menu.Hiski.selected.rightmost_subnode.xref }}
{{ menu.testnote }}
Time spent (s): {{ menu.pathsearch_time | number:3 }}
Found path between: {{ menu.pathsearch_from.name }} and {{ menu.pathsearch_to.name }}
First name Family name Date of baptism HisKi
{{ ind.name_first }} {{ ind.name_family }} {{ ind.birth_date_string }} {{ ind.xref }}
No path
{{ "::" + menu.pathsearch_error }}
Loading
+
+

AncestryAI is an application which uses machine learning to infer family trees and enables visualizing and searching the inferred trees. It has been developed to support genealogical research and to provide material for studies in computational social science, demography, and other disciplines.

News

(2018-03-24) A new version of AncestryAI with several improvements has been released.

Technical requirements

Only Chrome and Firefox browsers are currently supported.

Material

The family trees are inferred from about 5 million birth records from Finland collected by the HisKi project. The records cover years from the mid-1600's to mid-1800's and partly to the early 20th century. The coverage of the records was originally close to full, but the digitized material covers only parts of the complete dataset (some material is not digitized yet, and some is lost).

Usage instructions

You can start by searching for an individual in the upper-right panel and clicking one of the search results which opens the person in the Tree view (on the left). Clicking a person in the Tree view opens his or her family and brings the person's information to the Info view (lower-right). The Info view also displays the most probable parents of the selected person.

You can add and remove sub views from the plus and minus bars next to the borders and adjust their sizes from the middle bars. The tree view can be zoomed in and out using the mouse wheel.

NB: When building your family tree, you should verify the links inferred by the algorithm by studying the original parish records. However, with AncestryAI the process can be made more efficient since you can start from the most probable parent candidates.

Known issues

  1. Nodes in the Tree view cannot be moved.
  2. Individuals without a family name are currently not linked.
  3. The algorithm doesn't consider patronyms.

Source code

The source code is available on GitHub under the MIT Licence. Contributions are welcome.

Algorithm

The family links are inferred based on the names, birth dates, and birth locations of the individuals using a probabilistic machine-learning approach. For more information, see our papers Computationally Inferred Genealogical Networks Uncover Long-Term Trends in Assortative Mating and AncestryAI: A Tool for Exploring Computationally Inferred Family Trees.

Creators

AncestryAI is maintained by Eric Malmi, who is developing collective entity resolution methods for genealogical data in his PhD project. The web application has been originally implemented by Marko Rasa.

All feedback is welcome at: eric.malmi@aalto.fi

AncestryAI on tekoälysovellus, joka muodostaa automaattisesti sukupuita ja mahdollistaa niiden visualisoinnin sekä hakemisen. Sovellus on kehitetty tukemaan sukututkijoiden tekemää työtä sekä tuottamaan aineistoa laskennallisten yhteiskuntatieteiden, väestötieteen ym. tieteenalojen tutkimukseen.

Uutta

(2018-03-24) Uusi versio AncestryAI:sta on julkaistu! Mukana seuraavat päivitykset:

  1. Edistyneempi linkitysalgoritmi, joka päättelee 65.1% sukunimellisistä vanhemmista oikein (kts. lisää tästä artikkelista)
  2. Sukunimettömien henkilöiden linkitys patronyymien perusteella (näiden linkkien tarkkuutta ei ole testattu, mutta ne eivät todennäköisesti ole yhtä luotettavia kuin muut linkit)
  3. Hautaustapahtumien linkitys 12 %:iin kastetapahtumista (päätelty Kuolinvuosi näkyy Tietoa-näkymässä)
  4. Pieniä käyttöliittymäparannuksia
  5. Polkuhaku kahden henkilön välillä poistettu toistaiseksi käytöstä tehokkuussyistä (mikäli kaipaat tätä ominaisuutta, ota yhteyttä tekijöihin)

Tekniset vaatimukset

Tuettuja selaimia ovat Chrome ja Firefox.

Aineisto

Ohjelma käsittelee HisKi-aineiston noin 5 miljoonaa kastetapahtumaa. Kastetapahtumia löytyy 1600-luvun puolivälistä 1800-luvun puoliväliin ja osin 1900-luvun alkuun. Omien sukujuurten tutkimiseksi on näin ollen tarpeen tietää joku 1800-luvulla syntyneistä esivanhemmistaan. Huom! Tiedoissa esiintyy aukkoja ja virheitä.

Käyttöohjeet

Alkuun pääsee hakemalla haluamaansa henkilöä Haku-näkymässä (oikealla ylhäällä) ja klikkaamalla jotain hakutuloksista, jolloin henkilö ilmestyy Puu-näkymään (vasemmalla). Klikkaamalla henkilöä Puu-näkymässä avautuvat hänen mahdolliset lähisukulaisensa, minkä lisäksi hänen tietonsa ilmestyvät Tietoa-näkymään (oikealla alhaalla). Tietoa-näkymässä pääsee tarkastelemaan henkilön HisKistäkin löytyviä perustietoja, joiden lisäksi näkymä listaa henkilön automaattisesti päätellyt vanhemmat todennäköisyyksineen.

Näkymiä voi lisätä ja poistaa sivuilla olevista 'plus'- ja 'miinus'-palkeista, minkä lisäksi niiden kokoja voi säätää raahaamalla välipalkkeja. Puu-näkymässä on mahdollista zoomata sisään ja ulos hiiren rullalla.

Huom! Algoritmin päättelemiä linkkejä ei tule hyväksyä sellaisenaan, vaan ne on syytä vahvistaa alkuperäisistä lähteistä sekä muista aineistoista kuten rippikirjoista. AncestryAI:n avulla tätä prosessia voidaan kuitenkaan nopeuttaa kohdentamalla sukulaisten etsintää todennäköisimpiin henkilöihin.

Alinäkymät

Puu

Visualisoi pääteltyä sukupuuta siten, että henkilöiden y-koordinaatit perustuvat heidän kastepäivämääräänsä. Puuta voi laajentaa klikkaamalla henkilöä, jonka taustaväri on vaaleanvihreä.

Puun kasvaessa näkymä menee helposti sekavaksi, minkä välttämiseksi puun haaroja on mahdollista sulkea klikkaamalla henkilöiden välissä olevia 'miinus'-palloja. Näkymän voi keskittää valittuun henkilöön 'Paikanna'-painikkeesta ylhäältä tai tyhjentää kaikista henkilöistä 'Tyhjennä näkymä'-painikkeen kautta.

Haku

Mahdollistaa henkilöiden hakemisen. Hakua voi rajata lisäämällä hakuehtoja. Syntymävuosikenttään on mahdollista syöttää myös aikaväli, esimerkiksi: 1750-1760. Klikkaamalla hakutulosta henkilö ilmestyy Puu-näkymään.

Tietoa

Näyttää Puu-näkymässä valitun henkilön perustiedot. Lisäksi listaa algoritmin päättelemät ehdokkaat henkilön vanhemmiksi todennäköisyyksineen. Ehdokkaita voi avata Puu-näkymään klikkaamalla heidän nimiään.

Puu-näkymä piirtää tyypillisesti henkilön todennäköisimmät vanhemmat, mutta tietyissä tapauksissa se valitsee jonkin pienemmän todennäköisyyden ehdokkaan. Tämä tapahtuu silloin, kun jollain vanhemmalla on lapsia usean lähes samannimisen puolison kanssa, jolloin ohjelma päättelee, että nämä ovat todennäköisesti sama henkilö.

Kommentteja

Mahdollistaa kommenttien jättämisen liittyen valittuun henkilöön. Kommentit näkyvät myös muille käyttäjille, jotka valitsevat kyseisen henkilön. Nimi- ja email-kenttien täyttäminen on vapaaehtoista, ja sähköpostiosoite ei näy muille käyttäjille, vaan ainoastaan ohjelman ylläpitäjällä, joka voi tarvittaessa pyytää lisätietoja kommenttiin liittyen.

Kartta

Esittää Puu-näkymän henkilöt kartalla värittäen valitun henkilön valkoisella. Kartalle näytetään lisäksi linkit valitun henkilön vanhempiin ja lapsiin (elleivät he ole syntyneet samassa paikassa). Seurakuntien ja kylien koordinaatit on päätelty tässä tutkimusartikkelissa kuvatulla menetelmällä perustuen Maanmittauslaitoksen aineistoon.

Tunnetut ongelmat

Alla listattuna joitain AncestryAI:n tunnettuja puutteita. Näiden lisäksi on olemassa paljon ohjelman käytettävyyteen liittyviä parannusehdotuksia, joita ei ole toistaiseksi kyetty toteuttamaan.

  1. Henkilöitä ei ole mahdollista siirtää Puu-näkymässä.
  2. Ohjelma ei linkitä sukunimettömiä henkilöitä.
  3. Ohjelma ei käsittele patronyymejä.

Lähdekoodi

Sovelluksen lähdekoodi on saatavilla GitHubissa. Ulkopuolisia kontribuutioita otetaan mielellään vastaan - erityisesti liittyen käyttöliittymän parannuksiin.

Algoritmi

Ohjelma päättelee sukulaisuussuhteita perustuen henkilöiden nimiin sekä ikä- ja paikkatietoihin hyödyntäen tilastollista koneoppimista. Tarkempaa tietoa algoritmin toiminnasta löytyy artikkeleista Computationally Inferred Genealogical Networks Uncover Long-Term Trends in Assortative Mating sekä AncestryAI: A Tool for Exploring Computationally Inferred Family Trees.

Tekijät

Tällä hetkellä AncestryAI:n ainoana kehittäjänä toimii Eric Malmi, jonka väitöskirjatutkimus käsittelee mm. sukupuiden päättelyä tiedonlouhinnan ja koneoppimisen keinoin. Web-sovelluksen on toteuttanut alunperin Marko Rasa.

Palautetta sovelluksesta voi lähettää osoitteeseen: eric.malmi@aalto.fi. Kehitysehdotukset ja rakentava kritiikki ovat tervetulleita, ja kuulen myös mielelläni, jos olet onnistunut löytämään AncestyAI:n avulla jonkun aiemmin tuntemattoman sukulaisesi.