-
HisKi ID
{{ menu.Hiski.selected.xref }}
Name
{{ menu.Hiski.selected.name || "--" }}
Date of baptism
{{ menu.Hiski.selected.data.birth_date_string || "--" }}
Parish
{{ menu.Hiski.selected.data.location.name || "--" }}
Father name
{{ menu.Hiski.selected.data.dad_first || "--" }} {{ menu.Hiski.selected.data.dad_patronym || ""}} {{ menu.Hiski.selected.data.dad_family || ""}}
Father probabilities
Name Probability
{{ p.name }} {{ p.prob * 100 | number:4 }} %
Mother name
{{ menu.Hiski.selected.data.mom_first || "--" }} {{ menu.Hiski.selected.data.mom_patronym || ""}} {{ menu.Hiski.selected.data.mom_family || ""}}
Mother probabilities
Name Probability
{{ p.name }} {{ p.prob * 100 | number:4 }} %
soundex_family
{{ menu.Hiski.selected.data.soundex_family }}
fuzzy index
{{ menu.Hiski.selected.order_fuzzy_index }}
order reason
{{ menu.Hiski.selected.order_reason }}
leftmost_parent
{{ menu.Hiski.selected.leftmost_parent.xref }}
rightmost_parent
{{ menu.Hiski.selected.rightmost_parent.xref }}
rightmost_spouse
{{ menu.Hiski.selected.rightmost_spouse.xref }}
rightmost_subnode
{{ menu.Hiski.selected.rightmost_subnode.xref }}
{{ menu.testnote }}
Time spent (s): {{ menu.pathsearch_time | number:3 }}
Found path between: {{ menu.pathsearch_from.name }} and {{ menu.pathsearch_to.name }}
First name Family name Date of baptism HisKi
{{ ind.name_first }} {{ ind.name_family }} {{ ind.birth_date_string }} {{ ind.xref }}
No path
{{ "::" + menu.pathsearch_error }}
Loading
+
+

AncestryAI is an application which uses machine learning to infer family trees and enables visualizing and searching the inferred trees. It has been developed to support genealogical research.

Technical requirements

Only Chrome and Firefox browsers are currently supported.

Material

The family trees are inferred from about 5 million birth records from Finland collected by the HisKi project. The records cover years from the mid-1600's to mid-1800's and partly to the early 20th century. The coverage of the records was originally close to full, but the digitized material covers only parts of the complete dataset (some material is not digitized yet, and some is lost).

Usage instructions

You can start by searching for an individual in the upper-right panel and clicking one of the search results which opens the person in the Tree view (on the left). Clicking a person in the Tree view opens his or her family and brings the person's information to the Info view (lower-right). The Info view also displays the most probable parents of the selected person.

You can add and remove sub views from the plus and minus bars next to the borders and adjust their sizes from the middle bars. The tree view can be zoomed in and out using the mouse wheel.

NB: When building your family tree, you should verify the links inferred by the algorithm by studying the original parish records. However, with AncestryAI the process can be made more efficient since you can start from the most probable parent candidates.

Known issues

  1. Individuals without a family name are currently not linked.
  2. The algorithm doesn't consider patronyms.
  3. Nodes in the Tree view cannot be moved.

Source code

The source code is available on GitHub under the MIT Licence. Contributions are welcome.

Algorithm

The family links are inferred based on the names, birth dates, and birth locations of the individuals using a probabilistic machine-learning approach. For more information, see our paper AncestryAI: A Tool for Exploring Computationally Inferred Family Trees.

Creators

AncestryAI is maintained by Eric Malmi, who is developing collective entity resolution methods for genealogical data in his PhD project. The web application has been originally implemented by Marko Rasa.

All feedback is welcome at: eric.malmi@aalto.fi

AncestryAI on tekoälysovellus, joka muodostaa automaattisesti sukupuita ja mahdollistaa niiden visualisoinnin sekä hakemisen. Sovellus on kehitetty tukemaan sukututkijoiden tekemää työtä.

Tekniset vaatimukset

Tuettuja selaimia ovat Chrome ja Firefox. Internet Explorer -selaimella näkymät saattavat mennä toistensa päälle.

Aineisto

Ohjelma käsittelee HisKi-aineiston noin 5 miljoonaa kastetapahtumaa. Kastetapahtumia löytyy 1600-luvun puolivälistä 1800-luvun puoliväliin ja osin 1900-luvun alkuun. Omien sukujuurten tutkimiseksi on näin ollen tarpeen tietää joku 1800-luvulla syntyneistä esivanhemmistaan. Huom! Tiedoissa esiintyy aukkoja ja virheitä.

Käyttöohjeet

Alkuun pääsee hakemalla haluamaansa henkilöä Haku-näkymässä (oikealla ylhäällä) ja klikkaamalla jotain hakutuloksista, jolloin henkilö ilmestyy Puu-näkymään (vasemmalla). Klikkaamalla henkilöä Puu-näkymässä avautuvat hänen mahdolliset lähisukulaisensa, minkä lisäksi hänen tietonsa ilmestyvät Tietoa-näkymään (oikealla alhaalla). Tietoa-näkymässä pääsee tarkastelemaan henkilön HisKistäkin löytyviä perustietoja, joiden lisäksi näkymä listaa henkilön automaattisesti päätellyt vanhemmat todennäköisyyksineen.

Näkymiä voi lisätä ja poistaa sivuilla olevista 'plus'- ja 'miinus'-palkeista, minkä lisäksi niiden kokoja voi säätää raahaamalla välipalkkeja. Puu-näkymässä on mahdollista zoomata sisään ja ulos hiiren rullalla.

Huom! Algoritmin päättelemiä linkkejä ei tule hyväksyä sellaisenaan, vaan ne on syytä vahvistaa alkuperäisistä lähteistä sekä muista aineistoista kuten rippikirjoista. AncestryAI:n avulla tätä prosessia voidaan kuitenkaan nopeuttaa kohdentamalla sukulaisten etsintää todennäköisimpiin henkilöihin.

Alinäkymät

Puu

Visualisoi pääteltyä sukupuuta siten, että henkilöiden y-koordinaatit perustuvat heidän kastepäivämääräänsä. Puuta voi laajentaa klikkaamalla henkilöä, jonka taustaväri on vaaleanvihreä.

Puun kasvaessa näkymä menee helposti sekavaksi, minkä välttämiseksi puun haaroja on mahdollista sulkea klikkaamalla henkilöiden välissä olevia 'miinus'-palloja. Näkymän voi keskittää valittuun henkilöön 'Paikanna'-painikkeesta ylhäältä tai tyhjentää kaikista henkilöistä 'Tyhjennä näkymä'-painikkeen kautta.

Haku

Mahdollistaa henkilöiden hakemisen. Hakua voi rajata lisäämällä hakuehtoja. Syntymävuosikenttään on mahdollista syöttää myös aikaväli, esimerkiksi: 1750-1760. Klikkaamalla hakutulosta henkilö ilmestyy Puu-näkymään.

Tietoa

Näyttää Puu-näkymässä valitun henkilön perustiedot. Lisäksi listaa algoritmin päättelemät ehdokkaat henkilön vanhemmiksi todennäköisyyksineen. Ehdokkaita voi avata Puu-näkymään klikkaamalla heidän nimiään.

Puu-näkymä piirtää tyypillisesti henkilön todennäköisimmät vanhemmat, mutta tietyissä tapauksissa se valitsee jonkin pienemmän todennäköisyyden ehdokkaan. Tämä tapahtuu silloin, kun jollain vanhemmalla on lapsia usean lähes samannimisen puolison kanssa, jolloin ohjelma päättelee, että nämä ovat todennäköisesti sama henkilö.

Kommentteja

Mahdollistaa kommenttien jättämisen liittyen valittuun henkilöön. Kommentteja toivotaan sekä ohjelman päättelemistä oikeista että vääristä linkeistä, koska näiden tietojen perusteella menetelmää voidaan opettaa päättelemään linkit tarkemmin.

Kommentit näkyvät myös muille käyttäjille, jotka valitsevat kyseisen henkilön. Nimi- ja email-kenttien täyttäminen on vapaaehtoista, ja sähköpostiosoite ei näy muille käyttäjille, vaan ainoastaan ohjelman ylläpitäjällä, joka voi tarvittaessa pyytää lisätietoja kommenttiin liittyen.

Polkuhaku

Etsii lyhimmän polun kahden henkilön välille auttaen löytämään sukulaisuussuhteita. Lähtöhenkilö valitaan klikkaamalla jotakuta Puu-näkymässä, ja kohdehenkilön voi valita esim. ohjelman listaamien tunnettujen suomalaisten joukosta tai syöttämällä jonkun toisen henkilön HisKi ID:n.

Huom! Polun ollessa pitkä epävarmuudet kasaantuvat, eikä polku näin ollen todennäköisesti pidä paikkaansa kokonaisuudessaan.

Kartta

Esittää Puu-näkymän henkilöt kartalla värittäen valitun henkilön valkoisella. Kartalle näytetään lisäksi linkit valitun henkilön vanhempiin ja lapsiin (elleivät he ole syntyneet samassa paikassa). Seurakuntien ja kylien koordinaatit on päätelty tässä tutkimusartikkelissa kuvatulla menetelmällä perustuen Maanmittauslaitoksen aineistoon.

Tunnetut ongelmat

Alla listattuna joitain AncestryAI:n tunnettuja puutteita. Näiden lisäksi on olemassa paljon ohjelman käytettävyyteen liittyviä parannusehdotuksia, joita ei ole toistaiseksi kyetty toteuttamaan.

  1. Ohjelma ei linkitä sukunimettömiä henkilöitä.
  2. Ohjelma ei käsittele patronyymejä.
  3. Henkilöitä ei ole mahdollista siirtää Puu-näkymässä.

Lähdekoodi

Sovelluksen lähdekoodi on saatavilla GitHubissa. Ulkopuolisia kontribuutioita otetaan mielellään vastaan - erityisesti liittyen käyttöliittymän parannuksiin.

Algoritmi

Ohjelma päättelee sukulaisuussuhteita perustuen henkilöiden nimiin sekä ikä- ja paikkatietoihin hyödyntäen tilastollista koneoppimista. Tarkempaa tietoa algoritmin toiminnasta löytyy artikkelista AncestryAI: A Tool for Exploring Computationally Inferred Family Trees.

Tekijät

Tällä hetkellä AncestryAI:n ainoana kehittäjänä toimii Eric Malmi, jonka väitöskirjatutkimus käsittelee mm. sukupuiden päättelyä tiedonlouhinnan ja koneoppimisen keinoin. Web-sovelluksen on toteuttanut alunperin Marko Rasa.

Palautetta sovelluksesta voi lähettää osoitteeseen: eric.malmi@aalto.fi. Kehitysehdotukset ja rakentava kritiikki ovat tervetulleita, ja kuulen myös mielelläni, jos olet onnistunut löytämään AncestyAI:n avulla jonkun aiemmin tuntemattoman sukulaisesi.