AncestryAI is an application which uses machine learning to infer family trees and enables visualizing and searching the inferred trees. It has been developed to support genealogical research and to provide material for studies in computational social science, demography, and other disciplines.
(2018-03-24) A new version of AncestryAI with several improvements has been released.
Only Chrome and Firefox browsers are currently supported.
The family trees are inferred from about 5 million birth records from Finland collected by the HisKi project. The records cover years from the mid-1600's to mid-1800's and partly to the early 20th century. The coverage of the records was originally close to full, but the digitized material covers only parts of the complete dataset (some material is not digitized yet, and some is lost).
You can start by searching for an individual in the upper-right panel and clicking one of the search results which opens the person in the Tree view (on the left). Clicking a person in the Tree view opens his or her family and brings the person's information to the Info view (lower-right). The Info view also displays the most probable parents of the selected person.
You can add and remove sub views from the plus and minus bars next to the borders and adjust their sizes from the middle bars. The tree view can be zoomed in and out using the mouse wheel.
NB: When building your family tree, you should verify the links inferred by the algorithm by studying the original parish records. However, with AncestryAI the process can be made more efficient since you can start from the most probable parent candidates.
The source code is available on GitHub under the MIT Licence. Contributions are welcome.
The family links are inferred based on the names, birth dates, and birth locations of the individuals using a probabilistic machine-learning approach. For more information, see our papers Computationally Inferred Genealogical Networks Uncover Long-Term Trends in Assortative Mating and AncestryAI: A Tool for Exploring Computationally Inferred Family Trees.
AncestryAI is maintained by Eric Malmi, who is developing collective entity resolution methods for genealogical data in his PhD project. The web application has been originally implemented by Marko Rasa.
All feedback is welcome at: eric.malmi@gmail.com
AncestryAI on tekoälysovellus, joka muodostaa automaattisesti sukupuita ja mahdollistaa niiden visualisoinnin sekä hakemisen. Sovellus on kehitetty tukemaan sukututkijoiden tekemää työtä sekä tuottamaan aineistoa laskennallisten yhteiskuntatieteiden, väestötieteen ym. tieteenalojen tutkimukseen.
(2018-03-24) Uusi versio AncestryAI:sta on julkaistu! Mukana seuraavat päivitykset:
Tuettuja selaimia ovat Chrome ja Firefox.
Ohjelma käsittelee HisKi-aineiston noin 5 miljoonaa kastetapahtumaa. Kastetapahtumia löytyy 1600-luvun puolivälistä 1800-luvun puoliväliin ja osin 1900-luvun alkuun. Omien sukujuurten tutkimiseksi on näin ollen tarpeen tietää joku 1800-luvulla syntyneistä esivanhemmistaan. Huom! Tiedoissa esiintyy aukkoja ja virheitä.
Alkuun pääsee hakemalla haluamaansa henkilöä Haku-näkymässä (oikealla ylhäällä) ja klikkaamalla jotain hakutuloksista, jolloin henkilö ilmestyy Puu-näkymään (vasemmalla). Klikkaamalla henkilöä Puu-näkymässä avautuvat hänen mahdolliset lähisukulaisensa, minkä lisäksi hänen tietonsa ilmestyvät Tietoa-näkymään (oikealla alhaalla). Tietoa-näkymässä pääsee tarkastelemaan henkilön HisKistäkin löytyviä perustietoja, joiden lisäksi näkymä listaa henkilön automaattisesti päätellyt vanhemmat todennäköisyyksineen.
Näkymiä voi lisätä ja poistaa sivuilla olevista 'plus'- ja 'miinus'-palkeista, minkä lisäksi niiden kokoja voi säätää raahaamalla välipalkkeja. Puu-näkymässä on mahdollista zoomata sisään ja ulos hiiren rullalla.
Huom! Algoritmin päättelemiä linkkejä ei tule hyväksyä sellaisenaan, vaan ne on syytä vahvistaa alkuperäisistä lähteistä sekä muista aineistoista kuten rippikirjoista. AncestryAI:n avulla tätä prosessia voidaan kuitenkaan nopeuttaa kohdentamalla sukulaisten etsintää todennäköisimpiin henkilöihin.
Visualisoi pääteltyä sukupuuta siten, että henkilöiden y-koordinaatit perustuvat heidän kastepäivämääräänsä. Puuta voi laajentaa klikkaamalla henkilöä, jonka taustaväri on vaaleanvihreä.
Puun kasvaessa näkymä menee helposti sekavaksi, minkä välttämiseksi puun haaroja on mahdollista sulkea klikkaamalla henkilöiden välissä olevia 'miinus'-palloja. Näkymän voi keskittää valittuun henkilöön 'Paikanna'-painikkeesta ylhäältä tai tyhjentää kaikista henkilöistä 'Tyhjennä näkymä'-painikkeen kautta.
Mahdollistaa henkilöiden hakemisen. Hakua voi rajata lisäämällä hakuehtoja. Syntymävuosikenttään on mahdollista syöttää myös aikaväli, esimerkiksi: 1750-1760. Klikkaamalla hakutulosta henkilö ilmestyy Puu-näkymään.
Näyttää Puu-näkymässä valitun henkilön perustiedot. Lisäksi listaa algoritmin päättelemät ehdokkaat henkilön vanhemmiksi todennäköisyyksineen. Ehdokkaita voi avata Puu-näkymään klikkaamalla heidän nimiään.
Puu-näkymä piirtää tyypillisesti henkilön todennäköisimmät vanhemmat, mutta tietyissä tapauksissa se valitsee jonkin pienemmän todennäköisyyden ehdokkaan. Tämä tapahtuu silloin, kun jollain vanhemmalla on lapsia usean lähes samannimisen puolison kanssa, jolloin ohjelma päättelee, että nämä ovat todennäköisesti sama henkilö.
Mahdollistaa kommenttien jättämisen liittyen valittuun henkilöön. Kommentit näkyvät myös muille käyttäjille, jotka valitsevat kyseisen henkilön. Nimi- ja email-kenttien täyttäminen on vapaaehtoista, ja sähköpostiosoite ei näy muille käyttäjille, vaan ainoastaan ohjelman ylläpitäjällä, joka voi tarvittaessa pyytää lisätietoja kommenttiin liittyen.
Esittää Puu-näkymän henkilöt kartalla värittäen valitun henkilön valkoisella. Kartalle näytetään lisäksi linkit valitun henkilön vanhempiin ja lapsiin (elleivät he ole syntyneet samassa paikassa). Seurakuntien ja kylien koordinaatit on päätelty tässä tutkimusartikkelissa kuvatulla menetelmällä perustuen Maanmittauslaitoksen aineistoon.
Alla listattuna joitain AncestryAI:n tunnettuja puutteita. Näiden lisäksi on olemassa paljon ohjelman käytettävyyteen liittyviä parannusehdotuksia, joita ei ole toistaiseksi kyetty toteuttamaan.
Sovelluksen lähdekoodi on saatavilla GitHubissa. Ulkopuolisia kontribuutioita otetaan mielellään vastaan - erityisesti liittyen käyttöliittymän parannuksiin.
Ohjelma päättelee sukulaisuussuhteita perustuen henkilöiden nimiin sekä ikä- ja paikkatietoihin hyödyntäen tilastollista koneoppimista. Tarkempaa tietoa algoritmin toiminnasta löytyy artikkeleista Computationally Inferred Genealogical Networks Uncover Long-Term Trends in Assortative Mating sekä AncestryAI: A Tool for Exploring Computationally Inferred Family Trees.
Tällä hetkellä AncestryAI:n ainoana kehittäjänä toimii Eric Malmi, jonka väitöskirjatutkimus käsittelee mm. sukupuiden päättelyä tiedonlouhinnan ja koneoppimisen keinoin. Web-sovelluksen on toteuttanut alunperin Marko Rasa.
Palautetta sovelluksesta voi lähettää osoitteeseen: eric.malmi@gmail.com. Kehitysehdotukset ja rakentava kritiikki ovat tervetulleita, ja kuulen myös mielelläni, jos olet onnistunut löytämään AncestyAI:n avulla jonkun aiemmin tuntemattoman sukulaisesi.
{{ menu.Hiski.selected.name }}
Comments about data quality
{{ comment.author }}
{{ "::" + comment.type }} {{ comment.isodate }}
{{ line }}