Kiitos vierailustasi Nature.com. Käyttämäsi selaimessa on rajoitettu CSS -tuki. Parhaan tuloksen saavuttamiseksi suosittelemme selaimesi uudemman version käyttöä (tai kytkemällä yhteensopivuustilan käytöstä Internet Explorerissa). Sillä välin jatkuvan tuen varmistamiseksi näytämme sivuston ilman muotoilua tai JavaScriptiä.
Hampaita pidetään ihmiskehon iän tarkimpana indikaattorina, ja niitä käytetään usein oikeuslääketieteen ikäarvioinnissa. Pyrimme validoimaan tietojen louhintapohjaiset hammaskauden arviot vertaamalla 18-vuotisen kynnyksen arviointiarkkuutta ja luokittelun suorituskykyä perinteisillä menetelmillä ja tietojen louhintapohjaisilla ikäarvioilla. Korealaisilta ja Japanin kansalaisilta kerättiin yhteensä 2657 panoraaman röntgenkuvaa 15–23 -vuotiailta. Ne jaettiin harjoitusjoukkoon, jokainen sisälsi 900 korealaista röntgenkuvaa ja sisäiseen testijoukkoon, joka sisälsi 857 japanilaista röntgenkuvaa. Vertailimme perinteisten menetelmien luokituksen tarkkuutta ja tehokkuutta data -louhintamallien testijoukkoihin. Perinteisen menetelmän tarkkuus sisäisessä testijoukossa on hiukan korkeampi kuin datan louhintamallin, ja ero on pieni (keskimääräinen absoluuttinen virhe <0,21 vuotta, juuren keskimääräinen neliövirhe <0,24 vuotta). 18-vuotisen raja-arvon luokitussuoritus on myös samanlainen perinteisten menetelmien ja tiedon louhintamallien välillä. Siten perinteiset menetelmät voidaan korvata tiedon louhintamalleilla suoritettaessa oikeuslääketieteen ikäarviointia käyttämällä toisen ja kolmannen molaarin kypsyyttä korealaisilla murrosikäisillä ja nuorilla aikuisilla.
Hammaskauden arviointia käytetään laajasti oikeuslääketieteen ja lasten hammaslääketieteen suhteen. Erityisesti kronologisen iän ja hampaiden kehityksen välisen korkean korrelaation vuoksi hammaskehitysvaiheiden ikäarviointi on tärkeä kriteeri lasten ja nuorten iän arvioinnissa1,2,3. Nuorten mielestä hammashammaskypsyyteen perustuvan hammaskauden arviointi on kuitenkin rajoituksia, koska hammaskasvu on melkein valmis, lukuun ottamatta kolmatta molaareja. Nuorten ja nuorten iän määrittämisen oikeudellinen tarkoitus on tarjota tarkkoja arvioita ja tieteellisiä todisteita siitä, ovatko he saavuttaneet enemmistön ikän. Nuorten ja nuorten aikuisten lääketieteellisessä käytännössä Koreassa arvioitiin Lee: n menetelmää käyttämällä, ja OH et al 5: n ilmoittamien tietojen laillinen kynnysarvo.
Koneoppiminen on eräänlainen tekoäly (AI), joka oppii toistuvasti ja luokittelee suuria määriä tietoja, ratkaisee ongelmat yksinään ja ajaa tietojen ohjelmointia. Koneoppiminen voi löytää hyödyllisiä piilotettuja kuvioita suurissa datan määrissä6. Sitä vastoin klassisilla menetelmillä, jotka ovat työvoimavaltaisia ja aikaa vieviä, voi olla rajoituksia käsitellessään suuria määriä monimutkaisia tietoja, joita on vaikea käsitellä manuaalisesti7. Siksi viime aikoina on tehty monia tutkimuksia uusimpien tietokoneteknologioiden avulla ihmisen virheiden minimoimiseksi ja moniulotteisten datan tehokkaaseen käsittelyyn8,9,10,11,12. Erityisesti syvää oppimista on käytetty laajasti lääketieteellisessä kuvaanalyysissä, ja erilaisten ikäarviointimenetelmien analysoimalla automaattisesti radiografeja on ilmoitettu parantavan ikäarvioinnin tarkkuutta ja tehokkuutta13,14,15,16,17,18,19,20 . Esimerkiksi Halabi ym. Kehittivät konvoluutiohermostoverkkoihin (CNN) perustuvan koneoppimisalgoritmin luuranko -ajan arvioimiseksi lasten käsien röntgenkuvien avulla. Tämä tutkimus ehdottaa mallia, joka soveltaa koneoppimista lääketieteellisiin kuviin ja osoittaa, että nämä menetelmät voivat parantaa diagnostista tarkkuutta. Li et al14 arvioitu ikä lantion röntgenkuvista käyttämällä syvän oppimisen CNN: ää ja vertasi niitä regressiotuloksiin käyttämällä luutumisen vaiheen arviointia. He havaitsivat, että syvän oppimisen CNN -malli osoitti saman ikäisen arvioinnin suorituskyvyn kuin perinteinen regressiomalli. Guo et al: n tutkimuksessa [15] arvioi CNN -tekniikan ikätoleranssiluokituksen suorituskykyä hammaslääketieteen ortofotoihin, ja CNN -mallin tulokset osoittivat, että ihmiset ylittivät ikäryhmänsä luokituksen suorituskyvyn.
Useimmat tutkimukset ikäarvioinnista koneoppimisen käyttämällä syvän oppimismenetelmiä13,14,15,16,17,18,19,20. Syvään oppimiseen perustuvan ikäarvioinnin on ilmoitettu olevan tarkempi kuin perinteiset menetelmät. Tämä lähestymistapa tarjoaa kuitenkin vain vähän mahdollisuuksia esitellä tieteellistä perustaa ikäarvioille, kuten arvioissa käytetyt ikäindikaattorit. On myös laillinen kiista siitä, kuka suorittaa tarkastukset. Siksi hallinnolliset ja oikeudelliset viranomaiset ovat vaikeaa hyväksyä syväoppimiseen perustuvaa ikäarviointia. Tietojen louhinta (DM) on tekniikka, joka voi löytää paitsi odotettavissa olevan myös odottamattoman tiedon menetelmänä hyödyllisten korrelaatioiden löytämiseksi suurten tietojen välillä6,21,22 välillä. Koneoppimista käytetään usein tiedon louhinnassa, ja sekä tiedon louhinta että koneoppiminen käyttävät samoja avainalgoritmeja tietojen kuvioiden löytämiseen. Ikäarvio hammaskehityksen avulla perustuu tutkijan arviointiin kohdehammasten kypsyydestä, ja tämä arviointi ilmaistaan vaiheena jokaiselle kohdehampalle. DM: tä voidaan käyttää analysoimaan hammasarviointivaiheen ja todellisen iän välistä korrelaatiota, ja sillä on potentiaali korvata perinteinen tilastollinen analyysi. Siksi, jos käytämme DM -tekniikoita ikäarviointiin, voimme toteuttaa koneoppimisen oikeuslääketieteen ikäarviointiin huolehtimatta oikeudellisesta vastuusta. Useita vertailevia tutkimuksia on julkaistu mahdollisista vaihtoehdoista perinteisille manuaalisille menetelmille, joita käytetään oikeuslääketieteellisissä käytännöissä ja EBM-pohjaisissa menetelmissä hammaskauden määrittämiseksi. Shen et al23 osoittivat, että DM -malli on tarkempi kuin perinteinen Kamerer -kaava. Galibourg et al24 käyttivät erilaisia DM -menetelmiä iän ennustamiseen Demirdjian Criteer25: n mukaan ja tulokset osoittivat, että DM -menetelmä ylitti DemirdJian- ja Willems -menetelmät Ranskan väestön iän arvioinnissa.
Korean nuorten ja nuorten aikuisten hammaskauden arvioimiseksi Leen menetelmää 4 käytetään laajalti Korean oikeuslääketieteellisessä käytännössä. Tämä menetelmä käyttää perinteistä tilastollista analyysiä (kuten useita regressioita) korealaisten ja kronologisen iän välisen suhteen tutkimiseen. Tässä tutkimuksessa perinteisillä tilastollisilla menetelmillä saadut ikäarviointimenetelmät määritellään "perinteisiksi menetelmiksi". Leen menetelmä on perinteinen menetelmä, ja sen tarkkuus on vahvistanut Oh et ai. 5; Ikäarvioinnin sovellettavuus DM -malliin Korean oikeuslääketieteellisessä käytännössä on kuitenkin edelleen kyseenalainen. Tavoitteenamme oli tieteellisesti validoida ikän arvioinnin mahdollinen hyödyllisyys DM -malliin perustuen. Tämän tutkimuksen tarkoituksena oli (1) vertailla kahden DM -mallin tarkkuutta hammaslääketieteen ja (2) arvioimisessa 7 DM -mallin luokittelu suorituskyvyn vertaamiseksi 18 -vuotiaana, ja ne saadaan käyttämällä toisen toisen tilastollisen menetelmän kypsyyttä toisen toisena. ja kolmas molaarit molemmissa leuissa.
Kronologisen iän keskiarvo ja keskihajonta vaiheittain ja hammastyyppi esitetään verkossa lisätaulukossa S1 (harjoitusjoukko), lisätaulukko S2 (sisäinen testijoukko) ja lisätaulukko S3 (ulkoinen testijoukko). Harjoittelujoukosta saadut kappa-arvot ja tarkkailijoiden välinen luotettavuus olivat vastaavasti 0,951 ja 0,947. P -arvot ja 95%: n luottamusvälit Kappa -arvoille on esitetty online -lisätaulukossa S4. Kappa -arvo tulkittiin "melkein täydelliseksi", joka on yhdenmukainen Landisin ja Koch26: n kriteerien kanssa.
Vertaamalla keskimääräistä absoluuttista virhettä (MAE), perinteinen menetelmä ylittää hiukan DM -mallin kaikille sukupuolille ja ulkoiselle urostestijoukolle lukuun ottamatta monikerroksista perceptronia (MLP). Ero perinteisen mallin ja DM -mallin välillä sisäisessä MAE -testijoukossa oli miehillä 0,12–0,19 vuotta ja naisilla 0,17–0,21 vuotta. Ulkoisen testiakun aikana erot ovat pienempiä (miehillä 0,001–0,05 vuotta ja naisilla 0,05–0,09 vuotta). Lisäksi juuren keskimääräinen neliövirhe (RMSE) on hiukan alhaisempi kuin perinteinen menetelmä, jolla on pienemmät erot (0,17–0,24, 0,2–0,24 miesten sisäiselle testijoukolle ja 0,03–0,07, 0,04–0,08 ulkoiselle testijoukolle). ). MLP osoittaa hiukan parempaa suorituskykyä kuin yhden kerroksen perceptron (SLP), paitsi naisten ulkoisen testijoukon tapauksessa. MAE: lle ja RMSE: lle ulkoiset testijoukot pisteet ovat korkeammat kuin kaikkien sukupuolten ja mallejen sisäinen testijoukko. Kaikki Mae ja RMSE on esitetty taulukossa 1 ja kuvassa 1.
Mae ja RMSE perinteisten ja tiedon louhinnan regressiomallit. Keskimääräinen absoluuttinen virheen mae, juuren keskimääräinen neliövirhe RMSE, yksikerroksinen perceptron SLP, monikerroksinen perceptron MLP, perinteinen CM -menetelmä.
Perinteisten ja DM -mallejen luokitussuorituskyky (18 vuotta) osoitettiin herkkyyden, spesifisyyden, positiivisen ennustearvon (PPV), negatiivisen ennustearvon (NPV) ja vastaanottimen toimintaominaisuuden käyrän (AUROC) suhteen suhteen (AUROC) ja alueen perusteella (AUROC), 27 (taulukko 2, kuva 2 ja lisäkuva 1 verkossa). Sisäisen testiakun herkkyyden suhteen perinteiset menetelmät suoritettiin parhaiten miesten keskuudessa ja pahempaa naisten keskuudessa. Perinteisten menetelmien ja SD: n luokittelujen suorituskyvyn ero on kuitenkin 9,7% miehillä (MLP) ja vain 2,4% naisilla (XGBOOST). DM -malleissa logistinen regressio (LR) osoitti parempaa herkkyyttä molemmissa sukupuolissa. Sisäisen testijoukon spesifisyyden suhteen havaittiin, että neljä SD -mallia suoritettiin hyvin miehillä, kun taas perinteinen malli suoritti paremmin naisilla. Miesten ja naaraiden luokitussuorituskyvyn erot ovat vastaavasti 13,3% (MLP) ja 13,1% (MLP), mikä osoittaa, että luokituksen suorituskyvyn ero mallien välillä ylittää herkkyyden. DM -malleista tukivektorikoneen (SVM), päätöksentekopuu (DT) ja Random Forest (RF) -mallit suoritettiin parhaiten miesten keskuudessa, kun taas LR -malli suoritti parhaiten naisten keskuudessa. Perinteisen mallin ja kaikkien SD-mallien AUROC oli suurempi kuin 0,925 (kettinin naapuri (KNN) miehillä), mikä osoittaa erinomaisen luokituksen suorituskyvyn 18-vuotiaiden näytteiden syrjinnässä28. Ulkoisen testijoukon osalta luokitussuorituskyky laski herkkyyden, spesifisyyden ja AUROC: n suhteen sisäiseen testijoukkoon verrattuna. Lisäksi herkkyyden ja spesifisyyden ero parhaiden ja pahimpien mallien luokittelu suorituskyvyn välillä vaihteli 10%: sta 25%: iin ja oli suurempi kuin sisäisen testijoukon ero.
Tietojen louhinnan luokittelumallien herkkyys ja spesifisyys verrattuna perinteisiin menetelmiin, joiden raja on 18 vuotta. KNN K Lähin naapuri, SVM -tukivektorikone, LR -logistinen regressio, DT -päätöspuu, RF -satunnainen metsä, XGB XGBOOST, MLP MultiPerPeryer Perceptron, Perinteinen CM -menetelmä.
Ensimmäinen askel tässä tutkimuksessa oli verrata seitsemästä DM -mallista saatujen hammasikäisten arvioiden tarkkuutta, jotka saadaan perinteisellä regressiolla. Mae ja RMSE arvioitiin molemmille sukupuolille sisäisissä testijoukoissa, ja perinteisen menetelmän ja DM -mallin välinen ero vaihteli 44 - 77 päivää MAE: lle ja 62 - 88 päivää RMSE: lle. Vaikka perinteinen menetelmä oli hiukan tarkempi tässä tutkimuksessa, on vaikea päätellä, onko sellaisella pienellä erolla kliininen vai käytännöllinen merkitys. Nämä tulokset osoittavat, että hammaslääketieteen arvioinnin tarkkuus DM -mallia käyttämällä on melkein sama kuin perinteisen menetelmän. Suora vertailu aikaisempien tutkimusten tuloksiin on vaikeaa, koska yksikään tutkimus ei ole verrannut DM -mallien tarkkuutta perinteisillä tilastollisilla menetelmillä, joissa käytetään samaa tekniikkaa hampaiden tallentamiseksi samalla ikäryhmällä kuin tässä tutkimuksessa. Galibourg et al24 vertasivat MAE: tä ja RMSE: tä kahden perinteisen menetelmän (Demirjian Method25 ja Willems Method29) ja 10 DM -mallien välillä Ranskan väestössä 2–24 -vuotiaissa. He kertoivat, että kaikki DM -mallit olivat tarkempia kuin perinteiset menetelmät, ja erot olivat 0,20 ja 0,38 vuotta MAE: ssä ja 0,25 ja 0,47 vuotta RMSE: ssä verrattuna vastaavasti Willems- ja Demirdjian -menetelmiin. HaliBourg -tutkimuksessa esitetyn SD -mallin ja perinteisten menetelmien välisessä ristiriidassa otetaan huomioon lukuisat raportit30,31,32,33, että DemirdJian -menetelmä ei arvioi tarkasti hammaslääketieteen ikää muissa populaatioissa kuin Ranskan kanadalaisissa, joihin tutkimus perustui. Tässä tutkimuksessa. Tai et ai. 34 käyttivät MLP -algoritmia ennustamaan hammaskauden 1636 kiinalaisen oikomishoidon valokuvista ja vertasivat sen tarkkuutta Demirjian- ja Willems -menetelmän tuloksiin. He kertoivat, että MLP: llä on suurempi tarkkuus kuin perinteisillä menetelmillä. Ero DemirdJian -menetelmän ja perinteisen menetelmän välillä on <0,32 vuotta, ja Willems -menetelmä on 0,28 vuotta, mikä on samanlainen kuin tämän tutkimuksen tulokset. Näiden aiempien tutkimusten tulokset24,34 ovat myös yhdenmukaisia tämän tutkimuksen tulosten kanssa, ja DM -mallin ja perinteisen menetelmän ikäarviointitarkkuus ovat samanlaiset. Esitettyjen tulosten perusteella voimme kuitenkin vain varovaisesti päätellä, että DM -mallien käyttö iän arvioimiseksi voi korvata olemassa olevat menetelmät vertailevien ja vertailujen puutteen vuoksi aiempiin tutkimuksiin. Seuraavat seurantatutkimukset, joissa käytetään suurempia näytteitä tässä tutkimuksessa saatujen tulosten vahvistamiseksi.
SD: n tarkkuutta testaamalla hammaslääketieteen arvioinnissa jotkut osoittivat suurempaa tarkkuutta kuin tutkimuksemme. Stepanovsky ym. 35 sovelsivat 22 SD -mallia 976 šekin asukkaiden panoraaman röntgenkuviin 2,7 - 20,5 vuotta ja testasivat kunkin mallin tarkkuutta. He arvioivat yhteensä 16 vasemman ja alakerran pysyvän hampaan kehitystä käyttämällä Moorrees et al 36: n ehdottamia luokituskriteerejä. Mae vaihtelee välillä 0,64 - 0,94 vuotta ja RMSE vaihtelee välillä 0,85 - 1,27 vuotta, jotka ovat tarkempia kuin kaksi tässä tutkimuksessa käytettyä DM -mallia. Shen ym. He osoittivat, että kaikilla kolmella DM -mallilla on suurempi tarkkuus verrattuna perinteiseen Cameriere -kaavaan. Shenin tutkimuksen Mae ja RMSE olivat alhaisemmat kuin DM -mallissa tässä tutkimuksessa. Stepanovsky et ai. 35 ja Shen et ai. 23 voi johtua nuorempien koehenkilöiden sisällyttämisestä tutkimusnäytteisiin. Koska ikäarviot, joilla on kehityshampaita, muuttuvat tarkemmiksi, kun hampaiden lukumäärä kasvaa hammaskehityksen aikana, tuloksena olevan ikäarviointimenetelmän tarkkuus voi vaarantua, kun tutkimuksen osallistujat ovat nuorempia. Lisäksi MLP: n virheen ikä -arvioinnissa on hiukan pienempi kuin SLP: t, mikä tarkoittaa, että MLP on tarkempi kuin SLP. MLP: tä pidetään hiukan paremmin ikäarvioinnissa, mikä johtuu MLP38: n piilotetuista kerroksista. Naisten ulkoisesta näytteestä on kuitenkin poikkeus (SLP 1.45, MLP 1.49). Havainto, jonka mukaan MLP on tarkempi kuin SLP -ikä iän arvioinnissa, vaatii lisää retrospektiivisia tutkimuksia.
Verrattiin myös DM-mallin ja perinteisen menetelmän luokittelu suorituskykyä 18 vuoden kynnyksellä. Kaikki testatut SD-mallit ja perinteiset menetelmät sisäisessä testijoukossa osoittivat käytännössä hyväksyttäviä syrjintätasoja 18-vuotiaalle näytteelle. Miesten ja naisten herkkyys oli yli 87,7% ja 94,9%, ja spesifisyys oli yli 89,3% ja 84,7%. Kaikkien testattujen mallien AUROC ylittää myös 0,925. Tietojemme mukaan mikään tutkimus ei ole testannut DM-mallin suorituskykyä 18 vuoden luokitteluun, joka perustuu hammaslääkärin kypsyyteen. Voimme verrata tämän tutkimuksen tuloksia syvän oppimisen mallejen luokittelu suorituskykyyn panoraaman röntgenkuviin. Guo et al.15 laskivat CNN-pohjaisen syvän oppimisen mallin luokitussuorituskyvyn ja Demirjianin menetelmään perustuvan manuaalisen menetelmän tietyn ikäkynnyksen suhteen. Manuaalisen menetelmän herkkyys ja spesifisyys olivat vastaavasti 87,7% ja 95,5%, ja CNN -mallin herkkyys ja spesifisyys ylitti vastaavasti 89,2% ja 86,6%. He päättelivät, että syvän oppimisen mallit voivat korvata tai ylittää manuaalisen arvioinnin ikärajojen luokittelussa. Tämän tutkimuksen tulokset osoittivat samanlaisen luokitussuorituskyvyn; Uskotaan, että luokittelu DM -malleilla voi korvata perinteiset tilastolliset menetelmät ikäarviointiin. Malleista DM LR oli paras malli miesnäytteen herkkyyden suhteen ja herkkyys ja naisnäytteen spesifisyys. LR on miesten spesifisyys toiseksi. Lisäksi LR: tä pidetään yhtenä käyttäjäystävällisimmistä DM35-malleista, ja se on vähemmän monimutkainen ja vaikea käsitellä. Näiden tulosten perusteella LR: tä pidettiin korealaisen väestön 18-vuotiaille parhaana raja-luokitusmallina.
Kaiken kaikkiaan ikän estimoinnin tai luokituksen suorituskyvyn tarkkuus ulkoisessa testijoukossa oli heikko tai alhaisempi verrattuna sisäisen testijoukon tuloksiin. Jotkut raportit osoittavat, että luokituksen tarkkuus tai tehokkuus vähenee, kun Korean väestöön perustuvia ikäarvioita sovelletaan Japanin väestöön 5,39 ja tässä tutkimuksessa havaittiin samanlainen malli. Tätä heikkenemissuuntausta havaittiin myös DM -mallissa. Siksi iän arvioimiseksi, jopa DM: n käytettäessä analyysiprosessissa, natiivien populaatiotietojen, kuten perinteisten menetelmien, menetelmien, kuten perinteisten menetelmien, tulisi olla suositeltavia 5,39,40,41,42. Koska on epäselvää, voivatko syvän oppimisen mallit näyttää samanlaisia suuntauksia, tutkimuksissa, joissa verrataan luokituksen tarkkuutta ja tehokkuutta perinteisillä menetelmillä, DM -malleilla ja syvän oppimisen malleilla samoihin näytteisiin, tarvitaan sen varmistamiseksi, pystyykö keinotekoinen älykkyys voittaa nämä rotuerot rajoitetussa iässä. arviot.
Osoitamme, että perinteiset menetelmät voidaan korvata ikäarvioinnilla, joka perustuu DM -malliin oikeuslääketieteen ikäarviointikäytännössä Koreassa. Löysimme myös mahdollisuuden toteuttaa koneoppiminen oikeuslääketieteen ikäarviointiin. Tässä tutkimuksessa on kuitenkin selviä rajoituksia, kuten riittämätön määrä osallistujia tulosten lopullisesti määrittämiseksi, ja aiempien tutkimusten puute tämän tutkimuksen tulosten vertaamiseksi ja vahvistamiseksi. Tulevaisuudessa DM -tutkimukset tulisi suorittaa suuremmalla määrällä näytteitä ja monimuotoisempia populaatioita sen käytännön sovellettavuuden parantamiseksi perinteisiin menetelmiin verrattuna. Keinotekoisen älykkyyden käytön validoimiseksi iän arvioimiseksi useissa populaatioissa tarvitaan tulevia tutkimuksia DM: n ja syvän oppimisen mallien luokituksen tarkkuuden ja tehokkuuden vertaamiseksi perinteisillä menetelmillä samoissa näytteissä.
Tutkimuksessa käytettiin 2 657 ortografista valokuvaa, jotka on kerätty korealaisilta ja japanilaisilta aikuisilta, jotka olivat 15–23 -vuotiaita. Korean röntgenkuvat jaettiin 900 koulutusjoukkoon (19,42 ± 2,65 vuotta) ja 900 sisäiseen testijoukkoon (19,52 ± 2,59 vuotta). Koulutusjoukko kerättiin yhdessä instituutiossa (Soul St. Mary's Hospital), ja oma testijoukko kerättiin kahdessa instituutiossa (Soulin kansallinen yliopiston hammaslääketieteellinen sairaala ja Yonsei University Dental Hospital). Keräsimme myös 857 röntgenkuvaa toiselta väestöpohjaisesta tiedosta (Iwate Medical University, Japani) ulkoista testausta varten. Japanilaisten koehenkilöiden (19,31 ± 2,60 vuotta) röntgenkuvat valittiin ulkoiseksi testijoukoksi. Tiedot kerättiin takautuvasti hammashoidon aikana otettujen panoraaman röntgenkuvien hammaskehityksen vaiheiden analysoimiseksi. Kaikki kerätyt tiedot olivat nimettömiä lukuun ottamatta sukupuolta, radiografian syntymäpäivää ja päivämäärää. Sisällyttämis- ja poissulkemiskriteerit olivat samat kuin aiemmin julkaistut tutkimukset 4, 5. Näytteen todellinen ikä laskettiin vähentämällä syntymäaika radiografiasta. Näyteryhmä jaettiin yhdeksään ikäryhmään. Ikä- ja sukupuolijakaumat on esitetty taulukossa 3 Tämä tutkimus tehtiin Helsingin julistuksen mukaisesti, ja Soul Pyhän Marian katolisen yliopiston sairaalan institutionaalinen arviointilautakunta (IRB) (KC222WISI0328). Tämän tutkimuksen retrospektiivisen suunnittelun vuoksi tietoista suostumusta ei voitu saada kaikilta potilailta, joille tehtiin radiografinen tutkimus terapeuttisiin tarkoituksiin. Soul Korea University St. Mary's Hospital (IRB) luopui tiedoista tietoisen suostumuksen vaatimuksesta.
Bimaxillaryn toisen ja kolmannen molaarin kehitysvaiheet arvioitiin DEMIRCAN -kriteerien25 mukaan. Vain yksi hammas valittiin, jos samantyyppinen hammas löydettiin kunkin leuan vasemmalta ja oikealta puolelta. Jos molemmin puolin homologiset hampaat olivat erilaisissa kehitysvaiheissa, valittiin alhaisempi kehitysvaihe hammas arvioidun iän epävarmuuden huomioon ottamiseksi. Kaksi kokenutta tarkkailijaa pisteytettiin sata satunnaisesti valittua röntgenkuvaa harjoitusjoukosta tarkkailijoiden välisen luotettavuuden testaamiseksi predalbroinnin jälkeen hampaiden kypsyysasteen määrittämiseksi. Primaarinen tarkkailija arvioitiin sisäisen luotettavuuden luotettavuus kahdesti kolmen kuukauden välein.
Kunkin leuan toisen ja kolmannen molaarin sukupuoli- ja kehitysvaihe harjoitusjoukossa arvioitiin ensisijainen tarkkailija, joka oli koulutettu erilaisilla DM -malleilla, ja todellinen ikä asetettiin tavoitearvoksi. SLP- ja MLP -mallit, joita käytetään laajasti koneoppimisessa, testattiin regressioalgoritmeja vastaan. DM -malli yhdistää lineaariset toiminnot käyttämällä neljän hampaan kehitysvaihetta ja yhdistää nämä tiedot ikän arvioimiseksi. SLP on yksinkertaisin hermoverkko eikä sisällä piilotettuja kerroksia. SLP toimii solmujen välisen kynnyslähetyksen perusteella. SLP -malli regressiossa on matemaattisesti samanlainen kuin monen lineaarinen regressio. Toisin kuin SLP -malli, MLP -mallissa on useita piilotettuja kerroksia, joilla on epälineaariset aktivointifunktiot. Kokeissamme käytettiin piilotettua kerrosta, jossa oli vain 20 piilotettua solmua, joilla oli epälineaariset aktivointifunktiot. Käytä gradientin laskeutumista optimointimenetelmänä ja MAE: n ja RMSE: n tappiofunktiona koneoppimismallimme kouluttamiseksi. Parhaiten saatu regressiomalli sovellettiin sisäisiin ja ulkoisiin testijoukkoihin ja hampaiden ikä arvioitiin.
Kehitettiin luokitusalgoritmi, joka käyttää neljän hampaan kypsyyttä harjoittelussa ennustaakseen, onko näyte 18 -vuotias vai ei. Mallin rakentamiseksi johdettiin seitsemän esitys koneoppimisalgoritmeja6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBoost ja (7) MLP . LR on yksi yleisimmin käytetyistä luokitusalgoritmeista44. Se on valvottu oppimisalgoritmi, joka käyttää regressiota ennustaakseen tietyn luokan tiedon todennäköisyyden 0: sta 0: een ja luokittelee tiedot todennäköisempaan luokkaan tämän todennäköisyyden perusteella; Käytetään pääasiassa binaariluokitukseen. KNN on yksi yksinkertaisimmista koneoppimisalgoritmeista45. Kun annetaan uusia syöttötietoja, se löytää K -tiedot lähellä olemassa olevaa sarjaa ja luokittelee ne sitten luokkaan korkeimmalla taajuudella. Asetamme 3 harkittujen naapureiden lukumäärään (k). SVM on algoritmi, joka maksimoi kahden luokan välisen etäisyyden käyttämällä ytimen toimintoa laajentaaksesi lineaarisen tilan epälineaariseen tilaan, nimeltään Fields46. Tätä mallia varten käytämme bias = 1, teho = 1 ja gamma = 1 polynomi -ytimen hyperparametreina. DT: tä on sovellettu eri aloilla algoritmina koko tietojoukon jakamiseksi useisiin alaryhmiin edustamalla päätöksentekopisteiden sääntöjä puun rakenteessa47. Malli on määritetty vähimmäismäärällä tietueita solmua kohden 2 ja käyttää GINI -indeksiä laadun mittana. RF on ryhmämenetelmä, joka yhdistää useita DT: itä suorituskyvyn parantamiseksi käyttämällä bootstrap -aggregaatiomenetelmää, joka tuottaa heikon luokittelijan jokaiselle näytteelle piirtämällä satunnaisesti samankokoisia näytteitä useita kertoja alkuperäisestä tietojoukosta48. Käytimme 100 puuta, 10 puun syvyyttä, 1 minimisolmun kokoa ja gini -sekoitushakemistoa solmun erotuskriteerinä. Uusien tietojen luokittelu määritetään enemmistöäänestyksellä. XGBoost on algoritmi, joka yhdistää tehostavat tekniikat käyttämällä menetelmää, joka vie harjoitustiedot edellisen mallin todellisten ja ennustettujen arvojen välillä ja lisää virheen gradienteissa49 käyttämällä. Se on laajalti käytetty algoritmi hyvän suorituskyvyn ja resurssien tehokkuuden vuoksi, samoin kuin korkean luotettavuuden vuoksi ylikuormitusfunktiona. Malli on varustettu 400 tukipyörällä. MLP on hermoverkko, jossa yksi tai useampi perceptronit muodostavat useita kerroksia, joissa on yksi tai useampi piilotettu kerros tulo- ja lähtökerrosten välillä38. Tätä käyttämällä voit suorittaa epälineaarisen luokituksen, jossa kun lisäät syöttökerroksen ja saada tulosarvon, ennustettua tulosarvoa verrataan todelliseen tulosarvon ja virheeseen lisätään takaisin. Loimme piilotetun kerroksen, jossa jokaisessa kerroksessa oli 20 piilotettua neuronia. Jokaista kehittämäämme mallia käytettiin sisäisiin ja ulkoisiin sarjoihin luokituksen suorituskyvyn testaamiseksi laskemalla herkkyys, spesifisyys, PPV, NPV ja AUROC. Herkkyys määritellään näytteen suhde, jonka arvioidaan olevan 18 -vuotiaita tai sitä vanhempia näytteelle, jonka arvioidaan olevan vähintään 18 -vuotiaita. Spesifisyys on alle 18 -vuotiaiden näytteiden ja alle 18 -vuotiaiden arvioiden osuus.
Harjoittelujoukossa arvioidut hammasvaiheet muutettiin numeerisiksi vaiheiksi tilastollista analyysiä varten. Monimuuttujainen lineaarinen ja logistinen regressio suoritettiin ennustavien mallien kehittämiseksi jokaiselle sukupuolelle ja johdetaan regressiokaavoja, joita voidaan käyttää iän arviointiin. Käytimme näitä kaavoja arvioidaksesi hampaan ikää sekä sisäisille että ulkoisille testijoukkoille. Taulukko 4 näyttää tässä tutkimuksessa käytetyt regressio- ja luokittelumallit.
Tarkkailijoiden sisäinen ja välinen luotettavuus laskettiin käyttämällä Cohenin Kappa-tilastoja. DM: n ja perinteisten regressiomallien tarkkuuden testaamiseksi lasimme MAE: n ja RMSE: n käyttämällä sisäisten ja ulkoisten testijoukkojen arvioituja ja todellisia ikäryhmiä. Näitä virheitä käytetään yleisesti arvioimaan mallin ennusteiden tarkkuutta. Mitä pienempi virhe, sitä korkeampi ennusteen24 tarkkuus. Vertaa sisäisten ja ulkoisten testijoukkojen MAE: tä ja RMSE: tä, joka on laskettu DM: n ja perinteisen regression avulla. Perinteisten tilastojen 18 vuoden raja-arvon luokittelu suorituskyky arvioitiin käyttämällä 2 × 2 -varaustaulukkoa. Testisarjan laskettua herkkyyttä, spesifisyyttä, PPV: tä, NPV: tä ja AUROC: ta verrattiin DM -luokitusmallin mitattuihin arvoihin. Tiedot ilmaistaan keskiarvona ± keskihajonta tai lukumäärä (%) tietoominaisuuksista riippuen. Kaksipuoliset P-arvot <0,05 pidettiin tilastollisesti merkitsevänä. Kaikki rutiininomaiset tilastolliset analyysit suoritettiin käyttämällä SAS -versiota 9.4 (SAS Institute, Cary, NC). DM -regressiomalli toteutettiin Pythonissa käyttämällä Keras50 2.2.4 -tausta ja tensorFlow51 1.8.0 erityisesti matemaattisiin operaatioihin. DM -luokitusmalli toteutettiin Waiikato -tietoanalyysiympäristössä ja Konstanz Information Miner (KNIME) 4.6.152 -analyysialustassa.
Kirjoittajat myöntävät, että tutkimuksen päätelmiä tukevat tiedot löytyvät artikkelista ja lisämateriaaleista. Tutkimuksen aikana luodut ja/tai analysoidut tietojoukot ovat saatavana vastaavalta kirjoittajalta kohtuullisessa pyynnössä.
Ritz-Timm, S. et ai. Ikäarviointi: Huippuluokka vastaa rikosteknisen käytännön erityisvaatimuksia. kansainvälisyys. J. Legal Medicine. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. ja Olze, A. Elävien aiheiden oikeuslääketieteen arvioinnin nykyinen asema rikosoikeudellisiin syytteisiin. Oikeuslääketiede. lääke. Patologia. 1, 239–246 (2005).
Pan, J. et ai. Muokattu menetelmä 5–16 -vuotiaiden lasten hammaskauden arvioimiseksi Itä -Kiinassa. kliininen. Suullinen tutkimus. 25, 3463–3474 (2021).
Lee, SS jne. Toisen ja kolmannen molaarin kehityksen aikajärjestyksessä korealaisissa ja sen soveltamisessa oikeuslääketieteen ikäarviointiin. kansainvälisyys. J. Legal Medicine. 124, 659–665 (2010).
Voi, S., Kumagai, A., Kim, Sy ja Lee, SS: n ikäarvioinnin tarkkuus ja 18-vuotisen kynnyksen arviointi perustuen korealaisten ja japanilaisten toisen ja kolmannen molaarin kypsyyteen. PLOS One 17, E0271247 (2022).
Kim, Jy, et ai. Preoperatiivinen koneoppimispohjainen tietoanalyysi voi ennustaa unen kirurgian hoidon lopputuloksen OSA-potilailla. Tiede. Raportti 11, 14911 (2021).
Han, M. et ai. Tarkka ikäarvio koneoppimisesta ihmisen interventiolla tai ilman? kansainvälisyys. J. Legal Medicine. 136, 821–831 (2022).
Khan, S. ja Shaheen, M. Tietojen louhinnasta tietojen louhintaan. J.Informaatio. Tiede. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. ja Shaheen, M. Wisrule: Ensimmäinen kognitiivinen algoritmi assosiaatiosääntöjen louhintaan. J.Informaatio. Tiede. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. ja Abdullah U. Karm: Perinteinen tiedon louhinta, joka perustuu kontekstipohjaisiin yhdistyssääntöihin. laskea. Matta. jatkaa. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. ja Habib M. Syvän oppimispohjaisen semanttisen samankaltaisuuden havaitsemisen tekstitiedot käyttämällä. ilmoittaa. Teknologiat. hallinta. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. ja Shahin, M. Järjestelmä toiminnan tunnistamiseksi urheiluvideoissa. Multimedia. Työkalusovellukset https://doi.org/10.1007/S11042-021-10519-6 (2021).
Halabi, SS et ai. RSNA: n koneoppimishaaste lasten luun iässä. Radiology 290, 498–503 (2019).
Li, Y. et ai. Rikostekniikka-ikäarvio lantion röntgenkuvista syvän oppimisen avulla. Euro. säteily. 29, 2322–2329 (2019).
Guo, YC, et ai. Tarkka ikäluokitus käyttämällä manuaalisia menetelmiä ja syviä konvoluutiohermoverkkoja ortografisista projektiokuvista. kansainvälisyys. J. Legal Medicine. 135, 1589–1597 (2021).
Alabama Dalora et ai. Luukauden arviointi käyttämällä erilaisia koneoppimismenetelmiä: systemaattinen kirjallisuuskatsaus ja metaanalyysi. PLOS One 14, E0220242 (2019).
Du, H., Li, G., Cheng, K. ja Yang, J. Afrikkalaisten amerikkalaisten ja kiinan väestökohtainen ikäarvio perustuen ensimmäisten molaarien massakammioiden määrään kartiopehmeä tietokonetomografialla. kansainvälisyys. J. Legal Medicine. 136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK ja OH KS määrittävät elävien ihmisten ikäryhmät käyttämällä keinotekoisia älykkyyspohjaisia kuvia ensimmäisistä molaareista. Tiede. Raportti 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. ja Urschler, M. Automaattinen ikäarvio ja enemmistö -ikäluokitus monimuuttujaisten MRI -tietojen perusteella. IEEE J. Biomed. Terveyshälytykset. 23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. ja Li, G. Ajanestimointi, joka perustuu 3D -massan kammion segmentointiin ensimmäisten molaarien kartion säteen tietokonetomografiasta integroimalla syvän oppimisen ja tason sarjat. kansainvälisyys. J. Legal Medicine. 135, 365–373 (2021).
Wu, WT, et ai. Tietojen louhinta kliinisessä Big Datassa: Yleiset tietokannat, vaiheet ja menetelmät mallit. Maailman. lääke. Resurssi. 8, 44 (2021).
Yang, J. et ai. Johdanto lääketieteellisiin tietokantoihin ja tiedon louhintatekniikoihin Big Data -aikakaudella. J. Avid. Peruslääketiede. 13, 57–69 (2020).
Shen, S. et ai. Kamererin menetelmä hampaiden ikän arvioimiseksi koneoppimisella. BMC: n suun terveys 21, 641 (2021).
Galliburg A. et ai. Erilaisten koneoppimismenetelmien vertailu hammaskauden ennustamiseksi käyttämällä Demirdjian -lavastusmenetelmää. kansainvälisyys. J. Legal Medicine. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. ja Tanner, JM Uusi järjestelmä hammaskauden arvioimiseksi. Snort. biologia. 45, 211–227 (1973).
Landis, Jr ja Koch, GG: n tarkkailijan sopimuksen mittaukset kategoriallisista tiedoista. Biometriset tiedot 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK ja Choi HK. Kaksiulotteisen magneettikuvauksen tekstuurinen, morfologinen ja tilastollinen analyysi käyttämällä keinotekoisia älykkyystekniikoita primaaristen aivokasvainten erilaistumiseen. Terveystiedot. Resurssi. https://doi.org/10.4258/hir.2022.28.1.46 (2022).
Viestin aika: tammikuu 04-2024