Duński zespół badawczy stworzył model sztucznej inteligencji, który na podstawie zanonimizowanych danych z rejestrów państwowych w odniesieniu do niektórych przypadków potrafił z prawie 80% skutecznością przewidzieć, czy dana osoba umrze w ciągu czterech lat. Praca opublikowana w Nature Computational Science oraz w arxiv.org. Model także stawiał trafne przewidywania dotyczące niektórych podstawowych cech osobowości.

Średnia skuteczność przewidywania zgonu na poziomie 78% dotyczyła grupy wiekowej 35-65 lat (poziom ufności 95%). Do stworzenia takich predykcji użyto szczegółowych danych na temat: stanu zdrowia, zarobków, miejsca zamieszkania, rodzaju pracy, świadczeń społecznych, edukacji oraz informacji na temat ważnych momentów życia odnotowanych w rejestrach (takich jak awans, zakończenie szkolenia itd.).
Test modelu wyglądał tak, że wzięto historyczne oraz zanonimizowane dane 6 mln mieszkańców/mieszkanek Danii. Następnie wybrano z tych dane osób w wieku neutralnym w stosunku do śmiertelności (35-65) – młodsze byłyby skrajnie nieprawdopodobne a starsze zbyt prawdopodobne. Z tej grupy wybrano dane osób, które zmarły i dane osób, które żyły. Na podstawie sekwencji zdarzeń z życia model otrzymał zadanie postawienia predykcji, czy dana osoba umarła w wybranym okresie 4 lat. W stosunku do osób zmarłych w 78% przypadków trafnie odgadywał, że nie żyją.
Model sztucznej inteligencji generatywnej life2vec został zbudowany w architekturze transformerów. To oznacza, że dane wprowadzone do modelu były analizowane w powiązaniu ze sobą. Sieć neuronowa w pewnym sensie dostrzegła wzór powiązań między informacjami o stanie zdrowia i miejscem zamieszkania, rodzajem pracy, edukacją itd., co w konsekwencji przełożyło się na wyższą niż kiedykolwiek skuteczność szacowania ryzyko zgonu.

Dane różnego rodzaju zostały dla każdej z osób ułożone w sekwencje zdarzeń, które w czasie pokazują, kiedy i jaka praca, kiedy i czemu wizyta lekarska, awanse, przeprowadzki itd. Obrazowo mówiąc, życie każdego człowieka w takim modelu przypomina zdanie złożone ze słów i w zależności od zadanego pytania, model próbuje przewidzieć, co wynika z tej sekwencji słów i dopowiada kolejne słowo (stawia kropkę?). Co najciekawsze i logiczne: to mogą być także przewidywania dotyczące cech osobowości.
Okazało się, że na podstawie tych samych danych można przewidywać również niektóre podstawowe cechy osobowości (!): poziom samooceny, poziom pewności siebie w grupie, towarzyskość w pracy, poziom optymizmu (liveliness).
Model live2vec przewidział towarzyskość badanych osób i ocenił w zbliżony sposób do ankiet – porównywano wyniki ankiet oraz wyniki szacunków tego modelu.
Model ma słabości:
- Opiera się na danych wyłącznie duńskich więc wnioski z niego płynące mogą być gorzej przekładalne na inne społeczeństwa
- Użyto wyłącznie danych osób zarejestrowanych, pracujących, ubezpieczonych etc. Zatem model nie odpowiada na pytania dotyczące kategorii osób nie opisanych w państwowych rejestrach lub opisanych w sposób wybiórczy
- Oryginalne sekwencje zdarzeń w życiu (nietypowe kariery, nietypowe choroby etc.) będą osłabiać zdolność modelu do stawiania skutecznych prognoz względem takiej nietypowej osoby
- Najmocniej na trafność prognozy zgonu wpływały (oczywiście) dane medyczne a zatem brak takich danych lub mniejsza liczba takich danych osłabia model
- Model nie został przetestowany na szerokiej grupie, w pełni losowej a jedynie potwierdzano jego skuteczność w odniesieniu do grupy osób zmarłych. Pytanie, czy rozbudowa danych poprawiłaby skuteczność modelu
Zespół badawczy pisze także, że stosowanie tego modelu jest zabronione w celu profilowania konkretnych osób i podejmowania decyzji w odniesieniu do nich. Natomiast wyniki pracy modelu powinny móc służyć nauce oraz działaniom na rzecz społeczeństwa (policy development).
Tego rodzaju modele byłyby bardzo atrakcyjne np. dla instytucji ubezpieczeniowych czy bankowych, ale ich działanie w praktyce mogłoby prowadzić do ścisłej segregacji osób i powstania kategorii ludzi, którzy nie mogą dostać ani pożyczki, ani ubezpieczenia ponieważ model np. przewiduje zbyt duże ryzyko zgonu lub choroby. Można sobie wyobrazić wykluczenie takich osób w także w innych dziedzinach życia społecznego.
Jednocześnie działanie takich modeli może doprowadzić do powstania bardzo dobrze wycelowanych polityk zdrowia publicznego a w konsekwencji do znacznych oszczędności oraz poprawy jakości życia i wydłużenia jego średniej długości.
Kluczowe w takiej sytuacji stanie się to, jak chronione będą dane ludzi w państwowych rejestrach i innych, dużych zbiorach danych (np. social-media, producenci telefonów).
Unijne prawo dotyczące sztucznej inteligencji będzie zabraniać na terenie Unii działania oraz istnienia tzw. systemów oceny społecznej. Instytucje finansowe już teraz posługują się algorytmami oraz metodami rozpoznawania i oceny ryzyka związanego z udzielaniem pożyczek czy ubezpieczeń.
Na podstawie:
Danish researchers use machine learning to predict aspects of individual lives, including when someone might die | CNN
https://www.rynekzdrowia.pl/Badania-i-rozwoj/Sztuczna-inteligencja-pomoze-przewidziec-smierc-Ciekawe-badanie-dunskich-naukowcow,253503,11.html
https://medium.com/@adhxll/life2vec-the-ai-death-predictor-how-does-it-work-a-guide-for-the-public-1df196da11dc
https://eu.usatoday.com/story/tech/2023/12/21/artificial-intelligence-ai-death-calculator/72003778007/