Sinu ärisaladused ChatGPT küüsis: kus lõppeb privaatsusseade ja algab tegelik risk?
- Feb 17
- 4 min read
Updated: Feb 19

Paljud tehisintellekti kasutajad on jõudnud punkti, kus nad soovivad kontrollida, kuidas nende andmeid mudelite täiustamiseks ja treenimiseks kasutatakse. OpenAI pakub selleks kahte peamist teed: ChatGPT-sisene lüliti ja privaatsusportaali kaudu esitatav ametlik nõue.
Kuigi need võivad esmapilgul tunduda sarnased, on nende ulatuses ja mõjus olulisi erinevusi, mida privaatsusest hooliv kasutaja peaks teadma.
Kaks kontrollhooba: mis on nende erinevus?
OpenAI on loonud andmekasutuse juhtimiseks kaks erinevat tasandit. Valik sõltub sellest, kas soovid piirata andmekasutust ainult ChatGPT-s või laiemalt ka teistes OpenAI tarbijateenustes.
ChatGPT seaded (Settings → Data controls → Improve the model for everyone):
Tootesisene „iseteeninduslik“ lüliti. See on kontoülene (rakendub kogu kontole) ning sünkroonitakse veebi- ja mobiilirakenduse vahel.
Selle väljalülitamine tähendab, et uusi vestlusi ei kasutata mudelite täiustamiseks/treenimiseks, kuid vestlused võivad jääda sinu vestlusajalukku alles.
Ametlik privaatsusnõue (opt-out), mis on ulatuselt laiem kui ainult ChatGPT. See on mõeldud rakenduma ka teistele OpenAI tarbijatele suunatud teenustele (nt Sora ja Codex).
Oluline nüanss: ChatGPT-s tehtud seadistus ei mõjuta Sora eraldi seadeid, kuid privaatsusportaali kaudu esitatud opt-out on mõeldud rakenduma ka Sorale.
Praktiline soovitus: kui kasutad ainult ChatGPT-d, piisab tavaliselt tootesisesest lülitist. Kui aga kasutad mitut OpenAI teenust või soovid tsentraliseeritud kontrolli, on mõistlik esitada nõue privaatsusportaali kaudu ning hoida ka ChatGPT lüliti asendis Off.
Suurim eksiarvamus: „treenimise keelamine“ ei võrdu „nähtamatusega“
Oluline on mõista, et treenimise keelamine (not training) ei tähenda, et andmeid üldse ei salvestata või et neid ei vaadata kunagi üle. Sisu töötlemine ja mudelite treenimine on OpenAI jaoks kaks eraldi protsessi.
Isegi kui oled treenimise välja lülitanud, võib OpenAI sinu sisule ligi pääseda näiteks järgmistel juhtudel:
Turvalisus ja kuritarvituste ennetamine: süsteemid ja vajadusel ka inimesed võivad sisu üle vaadata, et tuvastada kuritarvitusi või ebaseaduslikku tegevust.
Teenuse osutamine ja hooldus: andmeid võib vaja minna teenuse toimimiseks ja klienditoe pakkumiseks.
Seadusest tulenevad kohustused: kohtumäärused või muud juriidilised nõuded võivad kohustada andmeid säilitama või väljastama.
Tähelepanu: kui sinu privaatsusnõue on nii kõrge, et „mitte ükski inimene ei tohi mitte mingil juhul andmeid näha“, siis ei saa seda praktiliselt tagada ükski laiatarbe pilvepõhine tehisintellektiteenus. Turvakontrollid ja juriidilised kohustused jätavad teenusepakkujale alati teoreetilise ligipääsu.
Kohad, kus privaatsusseaded sind ei kaitse
On rida olukordi, kus tavapärane treenimise keelamine ei pruugi olla piisav või kus andmete liikumine toimub teistsuguse loogika järgi:
Andmete säilitamine vs treenimine: treenimise keelamine ei kustuta vestlusajalugu. Kustutatud vestlused eemaldatakse OpenAI süsteemidest üldjuhul 30 päeva jooksul, välja arvatud juhul, kui rakenduvad juriidilised erandid (nt õiguslik säilitamiskohustus või kohtumenetlusega seotud „legal hold“).
Ajutised vestlused (Temporary Chat): need ei lähe treenimisse ega ilmu vestlusajaloos, kuid OpenAI võib turvalisuse eesmärgil hoida koopiat kuni 30 päeva.
Välised ühendused (connectors / rakendused): kui ühendad ChatGPT näiteks Gmaili või Drive’iga, liiguvad andmed kolmandatelt osapooltelt ChatGPT-sse. Treenimise väljalülitamine vähendab nende andmete kasutamist mudelite täiustamiseks, kuid andmevoog ise toimub siiski.
Mälufunktsioon (Memory): isegi kui kustutad vestluse, võivad salvestatud mälud säilida seni, kuni kustutad need eraldi.
Avalik jagamine: kui lood jagatava lingi (shared link) või avaldad midagi GPT Store’is, muutub sisu sisuliselt avalikuks ja privaatsusseaded seda tagantjärele „tagasi ei võta“.
Kuidas maksimeerida oma privaatsust?
Kui soovid hoida oma andmejälje võimalikult väikesena, järgi neid samme:
Lülita ChatGPT seadetes välja Improve the model for everyone.
Esita privaatsusportaali kaudu ametlik “Do not train on my content” nõue.
Kasuta Temporary Chat režiimi eriti tundlike teemade puhul.
Kustuta vestlused, mida sa ei soovi pikaajaliselt kontol hoida (arvestades üldjuhul kuni 30-päevast eemaldamistsüklit ja võimalikke juriidilisi erandeid).
Kui oled äri- või haridusklient, kaalu ChatGPT Business/Enterprise/Edu pakette, kus OpenAI järgi andmeid ei kasutata treenimiseks vaikimisi.
Lisaks seadete muutmisele on oluline mõista, kuidas toimib andmevahetus siis, kui ühendad oma ChatGPT kontoga väliseid teenuseid, näiteks Gmaili või Google Drive’i. See on eraldi „andmevoog“: teave liigub sinu Google’i kontolt OpenAI teenusesse ka siis, kui oled mudeli treenimise välja lülitanud.
ChatGPT ja Google’i ühendus: andmed liiguvad ka siis, kui treenimine on väljas
Kui annad ChatGPT-le loa (OAuth) pääseda ligi sinu Gmaili kirjadele või Drive’i failidele, luuakse aktiivne ühendus, mille kaudu saab teenus sinu nimel andmeid pärida. See tähendab, et iga kord, kui palud ChatGPT-l teha lepingust kokkuvõte või otsida postkastist arvet, saadetakse vajalik sisu töötlemiseks OpenAI süsteemidesse.
Oluline on teha vahet andmete liikumisel ja nende kasutamisel:
Free-, Plus- ja Pro-paketid: OpenAI võib rakendustest (nt Gmail/Drive) toodud teavet mudelite treenimiseks kasutada, kui seade “Improve the model for everyone” on sisse lülitatud.
Äripaketid (Business, Enterprise, Edu): nendes pakettides ei kasuta OpenAI rakenduste kaudu toodud teavet treenimiseks vaikimisi.
Andmevoog toimub alati: sõltumata sellest, kas treenimine on lubatud või mitte, peab sisu jõudma OpenAI serveritesse, et ChatGPT saaks seda üldse analüüsida või sellest kokkuvõtteid teha.
Uus ohukoht: „prompt injection“
Ühendatud kontod laiendavad märgatavalt riskipinda. Infoturbeeksperdid on leidnud, et pahatahtlikult koostatud dokument või kalenderkutse võib teatud tingimustel proovida mudelit „ära rääkida“ (nn prompt injection), suunates ChatGPT-d otsima ja väljastama tundlikku teavet sinu teistest ühendatud failidest või e-kirjadest. See muudab riskimudelit: sul on nüüd rohkem väärtuslikku sisu ühes kohas, millele tehisintellekt võib ligipääsu saada.
Kolm kuldreeglit privaatsuse maksimeerimiseks
Hoia treenimine väljas: veendu, et “Improve the model for everyone” on asendis OFF, eriti kui kasutad Gmaili või Drive’i ühendusi.
Ühenda ainult vajadusel: kasuta ühendusi konkreetse ülesande jaoks ja kui töö on valmis, katkesta ühendus seadete alt (Settings → Apps).
Ole konkreetne: ära palu ChatGPT-l „postkasti üldiselt analüüsida“ — kasuta täpseid otsingusõnu või vali konkreetne fail, et piirata andmehulka, millele teenus ligi pääseb.

Kas soovid teada, millistes protsessides saaks AI sinu ettevõttele kasu tuua?
Broneeri tasuta konsultatsioon ja hindame koos, millistes töövoogudes on peamine ajakulu ning kuidas tehisintellekti lahendused võiksid teie ettevõtte tulemuslikkust tõsta.




Comments