Anonimizacja PII · GDPR · EU AI Act

Zanonimizuj dokument,
zanim trafi do LLM-a.

pii.tools wykrywa 35 typów danych osobowych w dokumentach prawnych, medycznych i kadrowych — PDF, DOCX, skany i obrazy, wszystko lokalnie w przeglądarce na WASM + WebNN. Żadne dane nie opuszczają Twojego urządzenia.

Kategorie PII 8 grup, 35 typów
Modele NER eu-pii pl + multilang
Runtime Transformers.js · WASM + WebNN
Licencja Apache 2.0 · open source
0 bajtów wysłanych do serwera
100% lokalnie w przeglądarce
35 typów wykrywanych encji
~3s średni czas analizy strony
01 · jak to działa

Sześć rzeczy, które robi pii.tools.

Lokalna detekcja, pełna kontrola nad encjami, integracja z LLM-ami i wgląd w pipeline NER — wszystko w jednym narzędziu.

01

Działa lokalnie

Modele Transformers.js działają w przeglądarce. Twoje dokumenty nigdy nie opuszczają urządzenia — żadnego API, żadnej telemetrii.

02

Wybierz, co chronisz

Pełna kontrola nad każdą z 8 kategorii i 35 typów encji. Wyłącz to, co nieistotne dla Twojego przypadku — np. zostaw kwoty, zanonimizuj nazwiska.

03

Edytor adnotacji

Zaznacz brakujące encje, popraw fałszywe trafienia, dodaj własne. Każda adnotacja zachowuje token i typ przy deanonimizacji.

04

PDF, DOCX, obrazy — z OCR

Wklej tekst albo wrzuć pliki: PDF, DOCX, JPG, PNG, skany. Wbudowany OCR czyta zdjęcia i strony bez warstwy tekstowej. Tokeny są spójne między dokumentami — ten sam Jan Kowalski to zawsze [PERSON_NAME_1].

05

WebMCP dla LLM-ów

Połącz Claude Desktop bezpośrednio z narzędziem. LLM widzi tylko zanonimizowany tekst, a Ty otrzymujesz odpowiedź z odtworzonymi danymi.

06

Pipeline od kuchni

Każdy krok przetwarzania (segmentacja → NER → postprocessing) widoczny w panelu debug. Dla zespołów ML i red-teamerów PII.

gotowe do pracy

Otwórz narzędzie i zacznij.

Wklej, prześlij lub przeciągnij dokument. Modele ładują się raz — działają lokalnie, bez wysyłki danych.

Otwórz narzędzie
03 · integracja

LLM widzi tylko tokeny.
Ty widzisz oryginalny tekst.

pii.tools wystawia pięć narzędzi MCP do dowolnego klienta — Claude Desktop, Cursor, własny agent. Sources to zanonimizowane dokumenty wejściowe, outcomes to odpowiedzi modelu — i jedne, i drugie krążą wyłącznie w formie tokenów.

WebMCP — sources & outcomes w pętli z LLM-em

Wygeneruj token w kliencie MCP, wklej go w widget pii.tools. Od tego momentu LLM listuje i czyta zanonimizowane źródła, a swoje odpowiedzi zapisuje z powrotem w token-form. Deanonimizacja zachodzi tylko w Twojej przeglądarce, tylko dla Ciebie.

sources → list_sources read_source
outcomes ↔ list_outcomes read_outcome write_outcome
1
Użytkownik wrzuca dokumenty — pipeline anonimizuje je lokalnie do sources
browser · wasm
2
LLM woła list_sources / read_source — widzi tylko tokeny
mcp
3
LLM zapisuje odpowiedź przez write_outcome — nadal w token-form
mcp
4
Kolejne kroki agenta czytają poprzednie outcomes (read_outcome) bez kontaktu z PII
mcp
5
Przeglądarka deanonimizuje outcome wyłącznie w UI — dla Ciebie, nie dla modelu
browser