Zanim Wkleisz: Praktyczny Przewodnik po Bezpieczeństwie Danych przy Korzystaniu ze Sztucznej Inteligencji

Ten artykuł jest o halucynacjach. Dotyczy on mniej oczywistego błędu: dany tekst może wyglądać zupełnie normalnie, ale związany z nim sposób przetwarzania danych może stanowić zagrożenie. Dla organizacji społeczeństwa obywatelskiego ma to ogromne znaczenie. Informacje, z którymi pracujemy mają realne konsekwencje i dotyczą beneficjentów, ochrony, finansów, darczyńców, spraw kadrowych, konfliktów wewnętrznych oraz kwestii związanych z bezpieczeństwem. Innymi słowy, jest to dokładnie ten rodzaj treści, który nie powinien stać się „kontekstem rozmowy” w narzędziu, nad którym nie masz pełnej kontroli.

Nie chodzi o to, żeby odstraszyć Cię od sztucznej inteligencji. Celem jest zapewnienie przewidywalności jej stosowania – tak, aby twoja organizacja mogła czerpać korzyści z szybkości, przejrzystości i lepszych wersji roboczych, nie zamieniając przy tym „wydajności” w incydent związany z bezpieczeństwem danych napisany doskonałą gramatyką.

Zacznij od nudnego nawyku, który pozwala uniknąć ekscytujących problemów

Kiedy ktoś zapyta: „Czy możemy do tego wykorzystać sztuczną inteligencję?”, zacznij od trzech zupełnie prozaicznych pytań:

1. Kto ucierpi, jeżeli to wycieknie?
Pomyśl o beneficjentach, pracownikach, partnerach, darczyńcach oraz wiarygodności swojej organizacji.

2. Kto ucierpi, jeżeli odpowiedź będzie błędna?
Słaby wpis w mediach społecznościowych jest irytujący. Błędna decyzja dotycząca świadczeń, uprawnień, bezpieczeństwa lub finansów stanowi problem w zakresie zarządzania.

3 . Czy da się to sprawdzić niewielkim kosztem?
Jeżeli sprawdzenie poprawności wymaga czasu eksperta, dokumentów źródłowych lub analizy prawnej, to zadanie wiąże się z większym ryzykiem, niż mogłoby się wydawać na pierwszy rzut oka.

Te pytania są skuteczne, ponieważ zmuszają cię do tego, byś przestał skupiać się wyłącznie na samym zadaniu i zaczął myśleć o jego konsekwencjach. Już samo to pozwala zapobiec zaskakująco wielu możliwym do uniknięcia błędom.

Czasami najbezpieczniejszym sposobem kontroli jest po prostu „nie rób tego”

Sztuczna inteligencja doskonale radzi sobie z przygotowaniem i przerabianiem tekstów, upraszczaniem języka oraz tworzeniem różnych wariantów. Natomiast nie za dobrze jej idzie ponoszenie odpowiedzialności. Ta część pracy nadal należy do Ciebie.

Wiele organizacji próbuje rozwiązać ten problem jednym zdaniem: „Wymagana jest weryfikacja przez człowieka”. Rozsądne, owszem. Ale nie wystarczające. Jeże dane wejściowe zawierają wrażliwe dane osobowe lub jeżeli rezultat może mieć wpływ na decyzje dotyczące osób, sama weryfikacja nie zawsze jest wystarczająca. Czasami najbezpieczniejszym sposobem kontroli jest w ogóle nie wprowadzać danych do narzędzia. Można też przeprojektować proces tak, by sztuczna inteligencja miała dostęp wyłącznie do oczyszczonych materiałów o niskim ryzyku.

„Bezpieczne zadania” często w rzeczywistości nie są bezpieczne w codziennej pracy NGO

Niektóre zadania wydają się banalne: streszczanie, tłumaczenie, przeredagowywanie e-maili, porządkowanie notatek. W praktyce często właśnie w takich zadaniach pojawiają się dane wrażliwe.

Podsumowanie spotkania może zawierać nazwiska, informacje o konfliktach, wynagrodzenia, dane zdrowotne lub kwestie związane z ochroną danych. Przetłumaczony e-mail może zawierać informacje o lokalizacji, identyfikatory lub szczegóły kontekstowe, które nadal pozwalają zidentyfikować daną osobę. Przeredagowana notatka o darczyńcy może ujawnić więcej informacji o beneficjencie, niż zamierzano.

Tak więc prawdziwe pytanie nie brzmi: „Czy to zadanie nadaje się dla AI?” Brzmi ono: Co zawierają dane wejściowe i co się z nimi dzieje, gdy opuszczą one twoje systemy?

Ryzyko dotyczące danych w związku z wykorzystaniem AI składa się z trzech warstw

Kiedy organizacje rozmawiają o ryzyku związanym z AI, często zatrzymują się na jednym pytaniu: „Czy dostawca wykorzystuje nasze dane do celów treningowych?” To ma znaczenie, ale to tylko jedna z trzech warstw.

Warstwa 1: Wykorzystanie do treningu. Czy twoje prompty i wyniki zostaną wykorzystane do ulepszenia modelu? W ofertach dla biznesu i przedsiębiorstw przygotowanych przez głównych dostawców często zaznacza się, że treści klientów nie są domyślnie wykorzystywane do celów treningowych, chyba że klient wyrazi na to zgodę. OpenAI podaje tę informację w odniesieniu do usług ChatGPT Business, Enterprise, Edu, Healthcare, Teachers oraz w odniesieniu do API. Anthropic podaje te same informacje w odniesieniu do produktów komercyjnych, takich jak Claude for Work oraz API. Google twierdzi, że treści z serwisu Workspace z Gemini nie są wykorzystywane do trenowania modeli poza twoją domeną bez twojej zgody. Microsoft twierdzi, że prompty, odpowiedzi oraz dane z usługi Microsoft Graph w Microsoft 365 Copilot nie są wykorzystywane do trenowania podstawowych dużych modeli językowych (ang. Large Language Model, LLM).

Warstwa 2: Retencja danych i logi. Nawet po wyłączeniu treningu, treści mogą być nadal przechowywane przez pewien czas ze względów związanych z zapobieganiem nadużyciom, obsługą klienta, bezpieczeństwem lub kwestiami prawnymi. „Trening wyłączony” nie oznacza „informacje nie są nigdzie przechowywane”. Na przykład OpenAI w swoich materiałach dotyczących polityki prywatności dla przedsiębiorstw oddziela kwestie związane z wykorzystaniem danych do celów treningowych od kwestii związanych z retencją i kontrolami administracyjnymi.

Warstwa 3: Ścieżki dostępu. Kto ma wgląd w dane w związku z funkcjami i konfiguracją? Udostępnianie linków, narzędzia administracyjne, dzienniki audytowe, połączone aplikacje, wtyczki i agenci – wszystko to stwarza dodatkowe możliwości ujawnienia danych. Microsoft wyraźnie ostrzega, że Copilot wyświetla wyłącznie treści, do których użytkownicy mają już uprawnienia dostępu, co brzmi uspokajająco, dopóki nie przypomnisz sobie o niejasnościach, jakie często towarzyszą uprawnieniom w rzeczywistych organizacjach.

Wersje bezpłatne, płatne do użytku osobistego i wersje dla firm: co się faktycznie zmienia?

To rozróżnienie powinno znaleźć się w każdej poważnej polityce AI, ponieważ ludzie często zakładają, że stwierdzenie „płacę za to” oznacza, że „można to bezpiecznie wykorzystywać w pracy”. Nie.

Plany bezpłatne lub konsumenckie zazwyczaj sprawdzają się tylko w przypadku zadań o niskim ryzyku, niewymagających zachowania poufności i z usuniętymi danymi wrażliwymi. Mogą one charakteryzować się słabszymi mechanizmami kontroli administracyjnej, mniej rygorystycznymi ograniczeniami dotyczącymi udostępniania danych oraz mniejszym nadzorem ze strony organizacji. Niektóre produkty konsumenckie umożliwiają również wykorzystywanie treści użytkowników do celów treningowych, o ile użytkownik nie wyrazi sprzeciwu. Na przykład Anthropic rozdziela przetwarzanie danych konsumenckich od danych komercyjnych. OpenAI również rozróżnia plany dla użytkowników indywidualnych od ofert dla firm.

Płatne plany indywidualne najlepiej postrzegać jako „plany konsumenckie plus”. Można w nich zyskać więcej funkcji, szybsze modele lub mniej ograniczeń. Nie dają automatycznie zabezpieczeń dotyczących prywatności na poziomie korporacyjnym, gwarancji umownych, uprawnień administracyjnych ani mechanizmów egzekwowania zasad. To istotna różnica.

Plany biznesowe, zespołowe lub korporacyjne, to tu zaczynają się prawdziwe zastosowania organizacyjne. Produkty te zazwyczaj oferują domyślne zasady wykluczające trening, rozbudowane funkcje kontroli administracyjnej, lepsze zarządzanie dostępem oraz jaśniejsze wsparcie umowne w zakresie działań związanych z zapewnieniem zgodności z przepisami. Jednak nawet w tym przypadku usługa nie zapewni zgodności z przepisami niczym za sprawą magii. Nadal potrzebne są odpowiednie mechanizmy zarządzania, minimalizacja ryzyka oraz rozsądne zasady wewnętrzne.

Na przykład nawet w środowisku korporacyjnym pracownik może wkleić wrażliwe uwagi dotyczące danej sprawy na prywatnym czacie, a kilka miesięcy później treść ta może nadal znajdować się w historii konta, zostać wykorzystana w niewłaściwym kontekście lub skopiowana do dokumentu udostępnionego szerszemu gronu odbiorców, niż powinno to mieć miejsce w przypadku oryginalnych uwag.

„Czy mogę to wkleić do AI?” Wyjaśnienie postępowania w przystępny sposób

Oto najkrótszy, praktyczny schemat podejmowania decyzji.

Jeżeli informacje wejściowe nie zawierają danych osobowych, zadaj jeszcze jedno pytanie: czy nadal są one poufne? Obejmuje to kwestie strategiczne, finansowe, związane z bezpieczeństwem oraz poufne rozmowy z partnerami. Jeżeli odpowiedź brzmi „tak”, skorzystaj z zatwierdzonego narzędzia organizacyjnego i ogranicz wprowadzanie danych do minimum. Jeżeli nie, to zazwyczaj znajdujesz się w strefie mniejszego ryzyka: AI może tu pomóc, a twoim głównym zadaniem jest sprawdzenie wyników.

Jeżeli dane wejściowe zawierają dane osobowe, rozważ wykorzystanie AI tylko wtedy, gdy twoja organizacja dysponuje zatwierdzonym narzędziem i systemem przetwarzania danych osobowych, zazwyczaj jest to usługa biznesowa lub korporacyjna, obejmująca odpowiednie umowy, mechanizmy kontroli i zasady wewnętrzne. Jeżeli nie ma takich zabezpieczeń, dane osobowe nie powinny trafiać do narzędzi AI.

Jeżeli dane dotyczą kategorii szczególnych, osób niepełnoletnich albo kwestii związanych z ochroną, zdrowiem lub sprawami socjalnymi, wymagania są jeszcze wyższe: należy korzystać z AI wyłącznie w bezpiecznym, wyraźnie zatwierdzonym środowisku i tylko wtedy, gdy istnieje ku temu wyraźny powód. Zgodnie z RODO zgodność z przepisami zależy od podstawy prawnej, umowy, sposobu organizacji oraz celu przetwarzania danych, a nie od hasła reklamowego dostawcy czy faktu, że ktoś opłaca abonament.

To, że są to „zwykłe” dane osobowe, nie oznacza jeszcze, że są one „domyślnie bezpieczne”. Należy korzystać wyłącznie z zatwierdzonych narzędzi, ograniczać treść do minimum, w miarę możliwości usuwać wrażliwe informacje oraz upewnić się, że organizacja rozumie warunki umowy i kwestie techniczne.

Jakie narzędzia LLM można wykorzystywać w sposób zgodny z RODO

Zgodność z RODO to nie odznaka, którą można kupić w ramach abonamentu. Zależy ona od poziomu narzędzia, umowy, ustawień, przepływu pracy oraz zasad zarządzania obowiązujących w twojej organizacji.

Jednak niektóre narzędzia mogą wspierać zgodność z RODO w sposób bardziej wiarygodny niż chatboty przeznaczone do użytku konsumenckiego:

OpenAI – ChatGPT Business / Enterprise / Edu / API
Trening: domyślnie nie dla produktów biznesowych
Zgodność z RODO: tak, jeśli jest używane na poziomach biznesowych z odpowiednimi mechanizmami kontrolnymi w zakresie uprawnień administracyjnych, retencji i umów
Microsoft 365 Copilot
Trening: nie w przypadku promptów, odpowiedzi i danych Microsoft Graph
Zgodność z RODO: tak, w ramach prawidłowo zarządzanego dzierżawcy Microsoft 365 z wdrożonymi uprawnieniami i mechanizmami zapewniania zgodności
Google Workspace z Gemini
Trening: nie poza twoją domeną, jeżeli nie wyrażono na to zgody; obowiązują zabezpieczenia Workspace
Zgodność z RODO: tak, w odpowiednio zarządzanym środowisku Workspace z kontrolą administracyjną i wewnętrznymi zasadami zarządzania
Anthropic – Claude for Work / API
Trening: domyślnie nie dla produktów komercyjnych
Zgodność z RODO: tak, w planach komercyjnych z jasnymi zasadami organizacyjnymi dotyczącymi retencji, dostępu i udostępniania informacji zwrotnych

Pułapka: łączniki, wtyczki i agenci

W momencie, gdy narzędzie AI uzyska dostęp do twojego dysku, poczty e-mail, aplikacji Teams, platformy SharePoint lub systemów projektowych, profil ryzyka ulega zmianie. Nie zarządzasz już wyłącznie tym, co ktoś wpisał w prompcie. To ty decydujesz, do jakich danych narzędzie ma dostęp oraz jakie dane może pobierać, wyświetlać i ewentualnie ujawniać.

To właśnie w tym miejscu błędy związane z uprawnieniami mogą drogo kosztować. Zarówno Microsoft, jak i Google podkreślają, że zabezpieczenia w przedsiębiorstwie zależą od prawidłowego skonfigurowania istniejących uprawnień i narzędzi administracyjnych. Jeżeli twoja higiena dotycząca postępowania z plikami kuleje, sztuczna inteligencja nie naprawi tego samą siłą optymizmu.

Można sie również spotkać ze zjawiskiem tzw. „prompt injection”: ukryte instrukcje zawarte w dokumencie lub na stronie internetowej mogą wpływać na zachowanie AI. Mówiąc wprost, narzędzie może dać się zwieść materiałowi, który analizuje.

Twoja organizacja potrzebuje Kodeksu AI

Jeżeli chcesz, by bezpieczne korzystanie z AI objęło szersze grono niż tylko kilka ostrożnych osób, potrzebujesz wewnętrznego Kodeksu AI. Nie chodzi tu pięćdziesięciostronicowy pomnik ku czci biurokracji. Ma to być praktyczny dokument, z którego ludzie będą faktycznie korzystać.

Powinien on określać, które narzędzia zostały zatwierdzone, a które nie, z jakimi rodzajami danych można pracować w AI, a z jakimi nie, na jakich zasadach przebiega proces redagowania danych, jakie weryfikacje przez ludzi są wymagane, w jaki sposób obsługuje się moduły łączące i agentów, jakie działania należy podjąć po wystąpieniu incydentu oraz kiedy następuje przegląd zasad.

Nudne zarządzanie, ale to dobrze. Nudne zarządzanie to właśnie to, co sprawia, że ten sam, możliwy do uniknięcia błąd nie powtarza się dwanaście razy na dwanaście nieco różnych sposobów.

Bezpieczne użycie AI opiera się głównie na przewidywalnych nawykach

Sztuczna inteligencja może rzeczywiście pomagać NGO, ale to nie ona ponosi odpowiedzialności za skutki jej niewłaściwego wykorzystania. Odpowiedzialność ta spoczywa na twojej organizacji.

Właśnie dlatego bezpieczne korzystanie z AI rzadko sprowadza się do sprytnych promptów czy magicznych ustawień. Chodzi przede wszystkim o nawyki: ograniczaj zakres udostępnianych treści, dobieraj narzędzia odpowiednie do poziomu ryzyka, kontroluj dostęp, sprawdzaj zgodność wykorzystywanej AI z RODO, weryfikuj to, co ma znaczenie, a także dokumentuj zasady, aby przetrwały zmiany kadrowe.

A w przypadku wątpliwości, pamiętaj o jednej zasadzie: zmniejsz wrażliwość danych wejściowych zamiast uczynienia narzędzia bardziej „magicznym”.

Twoja opinia ma znaczenie

Co sądzisz o tym tekście? Poświęć 30 sekund, aby podzielić się swoją opinią i pomóc nam tworzyć wartościowe treści dla społeczeństwa obywatelskiego!

Niniejszy materiał powstał przy okazji projektu AI for Social Change realizowanego przez TechSoup w ramach programu Digital Activism Program przy wsparciu Google.org.

Do stworzenia treści autor wykorzystał sztuczną inteligencję. Jednak cały artykuł został stworzony oraz poddany weryfikacji i przeglądowi przez autora i zespół TechSoup.

Narzędzia AI szybko się rozwijają i choć dokładamy wszelkich starań, aby zapewnić rzetelność udostępnianych przez nas treści, czasami niektóre informacje mogą być nieaktualne. Jeżeli zauważysz, że jakaś informacja jest nieaktualna, daj nam o tym znać pod adresem contact@hive-mind.community