10 vuoden haaste tarjoaisi täydellisen paketin dataa kasvoja tunnistavalle algoritmille

Vanhoja ja uusia kuvia rinnastava haaste tuskin on vaarallinen, mutta ihmisten pitäisi olla tietoisia, mihin heidän dataansa voidaan käyttää.

Kun Facebookissa ja Instagramissa alkoi kiertää haaste, jossa ihmiset postaavat rinnakkain ensimmäisen ja viimeisen kuvan itsestään, en halunnut osallistua. En niinkään sen takia, että kokisin haasteessa jotain epäilyttävää, vaan koska oma Facebook-profiilikuvani oli tylsä silloin ja on tylsä nyt.

Sen sijaan törmäsin meemiin, jossa irvaillaan Facebookin ja Buzzfeedin järjestäneen haasteen parantaakseen kasvojen tunnitusalgoritmin kykyä tunnistaa ihmisten ikääntyminen ja jaoin sen.

Haastetta on ohjeistettu eri tavoin, mutta yleensä ohjeet neuvovat lisäämään ensimmäisen ja viimeisimmän profiilikuvan tai kuvat, joiden ottamisen välillä on 10 vuotta.

Varmaa tietoa haasteen alkuperästä minulla ei ollut, mutta meemi sai tajuamaan, millaisiin tarkoituksiin haastetta on mahdollista käyttää.

Samoilla linjoilla oli Wiredin mielipidesivuille kirjoittanut tietokirjailija Kate O’Neill. O’Neill ei myöskään osallistunut haasteeseen, vaan kirjoitti sen sijaan seuraavan twiitin:

 

O’Neill otti siis haasteeseen osaa kertomalla, miten hänen suhtautumisensa vastaaviin haasteisiin on muuttunut kymmenessä vuodessa. Hänen ajatuksensa keräsi huomiota Twitterissä, mutta monet eivät sitä purematta nielleet.

Yleisin vasta-argumentti ajatukselle, että “10 vuoden haaste” olisi tarkoitettu keräämään kasvojen tunnistusdataa ikääntymisestä, oli se, että kuvat ovat jo valmiiksi julkisia ja niistä löytyy aikakoodit, joten data on mahdollista louhia esiin ilman käyttäjien ystävällistä avustustakin.

Tähän O’Neill vastaa selittämällä, millainen hyöty on siitä, että käyttäjä itse valitsee kuvansa ja asettaa ne rinnakkain. Louhimalla kaikkia vanhoja kuvia läpi dataan päätyy kaikenlaista turhaa, sillä ihmiset eivät ole välttämättä postanneet kuviaan kronologisesti tai ne eivät välttämättä esitä käyttäjää.

“Toisin sanoen siitä olisi apua, jos tarjolla olisi puhdas, yksinkertainen ja selkeästi nimetty datasetti ennen ja jälkeen kuvia”, O’Neill kirjoittaa.

Villisti kiertävä haaste on siis luonut ison ja laadukkaan kasan dataa, jota olisi mahdollista käyttää kasvojen tunnistusalgoritmin opettamiseen.

Kuva: andriano_cz / Fotolia

Turhaan foliohattuiluun ei ole syytä, mutta samaan aikaan Facebookin viimeaikaiset toimet eivät herätä luottamusta tavasta, jolla palvelu kohtelee ihmisten dataa. Yhdysvaltain vaaleihin vaikuttanut Cambridge Analytica käytti nimenomaan erilaisia sosiaalisia pelejä, meemejä ja haasteita kerätessään valtavan datamääränsä.

Kuten O’Neill toteaa, kasvojentunnistuksen kehittyminen ei ole välttämättä vaarallista ja monella tapaa väistämätöntä. Kyse on kuitenkin isommasta kysymyksestä eli siitä, millä tavoin internetiin jättämäämme dataa voidaan käyttää ja kuinka tietoisia siitä käyttäjinä olemme.

Kommentoi juttua

Henkilökohtainen verkkosivusi (kotisivu, blogi tms.)
5 + 4 = Kirjoita laskutoimituksen tulos tai kirjaudu sisään, jolloin tarkistetta ei kysytä.
Jätä tyhjäksi