Термин Безопасность данных и ИИ-агенты Начальный

PII

PII — это персональные идентифицирующие данные: информация, по которой можно прямо или косвенно определить конкретного человека.

персональные данные personally identifiable information идентифицирующие данные личные данные персональная информация

PII расшифровывается как Personally Identifiable Information — персональные идентифицирующие данные. Это любая информация, которая позволяет прямо или косвенно определить человека. Иногда достаточно одного поля, например email или номер телефона. Иногда человек определяется по связке признаков: город, должность, компания, дата рождения и история обращений.

К PII обычно относят ФИО, email, телефон, адрес, паспортные данные, номер договора, банковские реквизиты, IP-адрес, ID клиента, аккаунт в системе, геолокацию, фото, голосовую запись и другие идентификаторы. В бизнес-системах PII часто встречается в CRM, тикетах поддержки, документах, счетах, звонках, email и базах знаний.

Для ИИ-агентов PII важно учитывать заранее. Агент может читать документы, обрабатывать письма, суммировать звонки, искать по CRM, писать ответы клиентам, вызывать API и сохранять trace. Если персональные данные без контроля попадают в промпты, логи, evals или внешние инструменты, риск утечки быстро растет.

Работа с PII строится по принципу минимизации: агент должен получать только те персональные данные, которые действительно нужны для задачи. Все лишнее лучше маскировать, редактировать или не передавать в модель. Для production-сценариев PII нужно защищать через access control, PII masking, redaction, data retention, policy gate, audit log и проверки на sensitive data disclosure.

Примеры

Email клиента, номер телефона и ФИО в обращении поддержки являются PII.
Номер договора сам по себе может быть PII, если по нему можно найти конкретного клиента.
Запись звонка содержит голос, имя, номер телефона и детали обращения, поэтому требует аккуратной обработки.
В CRM-карточке лида есть должность, компания, email и история общения — это набор персональных данных.
Перед отправкой тикета в модель агент заменяет email на [EMAIL], а телефон на [PHONE].

Где используется

Определять, какие поля в CRM, тикетах, документах и логах являются персональными данными.
Решать, какие данные можно передавать ИИ-агенту, а какие нужно маскировать.
Настраивать PII masking и redaction перед отправкой текста в модель.
Защищать agent trace, логи, evals и datasets от лишних персональных данных.
Ограничивать доступ к PII через ACL, роли и policy gate.
Проверять ответы агента на sensitive data disclosure.
Настраивать data retention: сколько хранить обращения, логи и результаты обработки.
Обучать команду распознавать прямые и косвенные идентификаторы.
Снижать риски при RAG, tool calling, обработке документов и звонков.

Связанные термины

ACL Agent trace Audit log Call transcript Chat ACL Data retention Dataset для evals Document parser

Частые вопросы

Что такое PII простыми словами?

PII — это данные, по которым можно узнать конкретного человека: имя, email, телефон, адрес, документы, ID клиента или связка нескольких признаков.

Какие данные считаются PII?

ФИО, email, телефон, адрес, паспортные данные, банковские реквизиты, IP, ID клиента, геолокация, фото, голос и другие данные, которые помогают идентифицировать человека.

Почему PII важно для ИИ-агентов?

Агенты часто читают письма, документы, CRM и тикеты. Если не контролировать PII, персональные данные могут попасть в промпты, логи, trace, evals или внешние инструменты.

Чем PII отличается от sensitive data?

PII — это данные для идентификации человека. Sensitive data шире: туда могут входить коммерческие тайны, токены, финансовые данные, медицинская информация и другие чувствительные сведения.

Как безопаснее работать с PII в AI-системах?

Нужно передавать минимум данных, маскировать лишнее, ограничивать доступ, вести audit log, задавать data retention и проверять, не раскрывает ли агент PII в ответах.

Где читать дальше

Статьи по теме

Пошаговые инструкции 10 мин

Как использовать GPT Image для редактирования готового изображения: фон, детали, формат

Пошаговая инструкция: как через GPT Image заменить фон, убрать лишние детали, адаптировать изображение под разные форматы и сохранить главный объект без искажений.

пошаговая инструкция GPT Image редактирование изображений

Пошаговые инструкции 10 мин

Как использовать Kimi для анализа длинного PDF и подготовки краткой выжимки

Пошаговая инструкция: как подготовить PDF, загрузить его в Kimi, получить карту документа, краткую выжимку, тезисы с доказательствами, спорные места и итоговую записку.

PDF анализ документов пошаговая инструкция

Пошаговые инструкции 11 мин

Как использовать DeepSeek для разбора кода и поиска ошибок в проекте

Пошаговая инструкция: как подготовить код, дать DeepSeek контекст, найти баги, получить минимальный patch, составить тесты и безопасно проверить правку в проекте.

code review пошаговая инструкция DeepSeek

Пошаговые инструкции 11 мин

Как использовать Google Gemini для анализа таблицы продаж и поиска точек роста

Пошаговая инструкция: как подготовить таблицу продаж, разобрать ее в Google Gemini, найти просадки по каналам, товарам и менеджерам, собрать гипотезы роста и отчет руководителю.

таблицы Google Sheets AI для бизнеса

Пошаговые инструкции 11 мин

Как использовать Claude для анализа большого договора и подготовки списка рисков

Пошаговая инструкция: как загрузить договор в Claude, получить резюме, найти красные флаги, собрать таблицу рисков, вопросы юристу и черновик правок.

Claude договоры пошаговая инструкция

Пошаговые инструкции 12 мин

Как сделать AI-ассистента на OpenAI GPT для ответов на заявки с сайта

Пошаговая инструкция: форма сайта отправляет заявку, OpenAI GPT разбирает сообщение, возвращает JSON, готовит черновик ответа и передает менеджеру в Telegram, CRM или почту.

CRM structured output AI-ассистент

Инструменты

Связанные инструменты

Open-source / paid DeepEval

Фреймворк для evals LLM, RAG и AI-агентов: correctness, faithfulness, hallucination, safety, regression и CI-проверки.

Open source Docling

Open-source инструмент для разбора PDF и документов: текст, таблицы, layout, markdown/json и подготовка файлов к RAG/AI-пайплайнам.

Open-source and paid platform LangChain

Фреймворк для LLM-приложений, chains, agents, RAG, tools и context orchestration.

Open-source and paid platform LangGraph

Фреймворк для stateful AI-агентов, графов, памяти, handoff и многошаговых workflow.

Free tier and paid plans LangSmith

Платформа для tracing, debugging, datasets и evals LLM-приложений и AI-агентов.

Open-source and paid platform LlamaIndex

Фреймворк для подключения данных к LLM: RAG, индексы, retrieval, agents и workflows.