Zanonimizuj dokument,
zanim trafi do LLM-a.
pii.tools wykrywa 35 typów danych osobowych w dokumentach prawnych, medycznych i kadrowych — PDF, DOCX, skany i obrazy, wszystko lokalnie w przeglądarce na WASM + WebNN. Żadne dane nie opuszczają Twojego urządzenia.
Sześć rzeczy, które robi pii.tools.
Lokalna detekcja, pełna kontrola nad encjami, integracja z LLM-ami i wgląd w pipeline NER — wszystko w jednym narzędziu.
Działa lokalnie
Modele Transformers.js działają w przeglądarce. Twoje dokumenty nigdy nie opuszczają urządzenia — żadnego API, żadnej telemetrii.
Wybierz, co chronisz
Pełna kontrola nad każdą z 8 kategorii i 35 typów encji. Wyłącz to, co nieistotne dla Twojego przypadku — np. zostaw kwoty, zanonimizuj nazwiska.
Edytor adnotacji
Zaznacz brakujące encje, popraw fałszywe trafienia, dodaj własne. Każda adnotacja zachowuje token i typ przy deanonimizacji.
PDF, DOCX, obrazy — z OCR
Wklej tekst albo wrzuć pliki: PDF, DOCX, JPG, PNG, skany. Wbudowany OCR czyta zdjęcia i strony bez warstwy tekstowej. Tokeny są spójne między dokumentami — ten sam Jan Kowalski to zawsze [PERSON_NAME_1].
WebMCP dla LLM-ów
Połącz Claude Desktop bezpośrednio z narzędziem. LLM widzi tylko zanonimizowany tekst, a Ty otrzymujesz odpowiedź z odtworzonymi danymi.
Pipeline od kuchni
Każdy krok przetwarzania (segmentacja → NER → postprocessing) widoczny w panelu debug. Dla zespołów ML i red-teamerów PII.
Otwórz narzędzie i zacznij.
Wklej, prześlij lub przeciągnij dokument. Modele ładują się raz — działają lokalnie, bez wysyłki danych.
LLM widzi tylko tokeny.
Ty widzisz oryginalny tekst.
pii.tools wystawia pięć narzędzi MCP do dowolnego klienta — Claude Desktop, Cursor, własny agent. Sources to zanonimizowane dokumenty wejściowe, outcomes to odpowiedzi modelu — i jedne, i drugie krążą wyłącznie w formie tokenów.
WebMCP — sources & outcomes w pętli z LLM-em
Wygeneruj token w kliencie MCP, wklej go w widget pii.tools. Od tego momentu LLM listuje i czyta zanonimizowane źródła, a swoje odpowiedzi zapisuje z powrotem w token-form. Deanonimizacja zachodzi tylko w Twojej przeglądarce, tylko dla Ciebie.
list_sources
read_source
list_outcomes
read_outcome
write_outcome
list_sources / read_source — widzi tylko tokenywrite_outcome — nadal w token-formread_outcome) bez kontaktu z PII