Конвертер омоглифов — обнаружение и очистка Unicode
Преобразование выполняется с максимальной эффективностью: отображаемые путаные элементы и свертывание NFKC являются детерминированными, но некоторые допустимые Unicode не будут помечены.
Вставить или ввести — результаты обновляются по мере ввода (слегка подпрыгивают при длительном вводе).
Подозрительные символы в исходном виде подчеркнуты и помечены как «подозрительно». в дополнение к выделению цвета.
Пока нет персонажей для анализа. Вставьте текст выше, чтобы увидеть разбивку гомоглифов и путанных слов.
Обнаружение визуально похожих символов Unicode и преобразование в более безопасный ASCII или нормализованный Unicode. Бесплатно в браузере.
Что делает этот конвертер гомоглифов
Конвертер гомоглифов обнаруживает символы Юникода, которые могут выглядеть как обычные латинские буквы или цифры (конфузируемые символы), и показывает, как они были нормализованы или заменены. Вы также можете запустить команду «Создать гомоглифы», чтобы создать детерминированные поддельные строки из простого ASCII для тестирования. Этот бесплатный конвертер путаных символов и средство проверки путающихся символов в Юникоде полностью работают в вашем браузере — используйте его в качестве инструмента нормализации Юникода, средства очистки поддельного текста или конвертера похожих символов для обеспечения безопасности и модерации.
Как использовать этот инструмент нормализации Юникода
- Вставьте или введите текст, который вы хотите проверить, в области ввода.
- Выберите «Сохранить читаемый Юникод», «Строгий резерв ASCII» или «Создать гомоглифы» в зависимости от того, очищаете ли вы вставленный текст или создаете тестовые образцы из ASCII.
- Сравните оригинал (с яркими моментами) и вывод рядом; просмотрите таблицу анализа на предмет кодов и причин.
- Используйте «Копировать выходной текст», чтобы скопировать результат, или «Очистить», чтобы сбросить его.
Режимы преобразования: читаемый Юникод или Юникод в ASCII или генерация
- Функция Preserve Readable Unicode сначала применяет связанную сбивчивую карту, а затем нормализацию NFKC при изменении символа. Вывод может по-прежнему содержать буквы, отличные от ASCII, которые не были помечены.
- Строгий резерв ASCII использует те же правила обнаружения, но предпочитает замену ASCII из карты. Персонажи, отсутствующие на карте, остаются без изменений, если NFKC не изменит их; этот режим более строгий и лучше подходит для рабочих процессов очистки поддельного текста.
- Генерация гомоглифов обрабатывает введенные данные слева направо и заменяет каждую букву или цифру ASCII одним детерминированным гомоглифом из той же связанной карты (обратная очистке). Символы без выбранной замены остаются в формате ASCII.
Что здесь считается подозрительным
В режимах очистки символ помечается, когда он является известным и спутанным с определенной заменой или когда нормализация NFKC изменяет его (например, цифры полной ширины). В режиме генерации «подозрительным» отмечается каждая позиция, в которой была заменена буква или цифра ASCII. Это не полный аудит безопасности Unicode — только детерминированные правила.
Распространенные случаи использования
- Проверка поддельных имен пользователей, доменов или гомоглифических атак во вставленных строках.
- Модерация и проверка доверия и безопасности трюков с похожими персонажами.
- Отладка разработчиком проблем с кодировкой наряду с представлением детектора гомоглифа.
Ограничения и примечания по безопасности
Входящая в комплект карта охватывает распространенные кириллические, греческие и полноширинные аналоги — не все Unicode можно спутать. Режим генерации предназначен только для авторизованного тестирования; не используйте его для обмана людей или обхода защиты. Результаты являются детерминированными, а не оценками риска, основанными на ОД. Всегда комбинируйте с человеческим контролем при принятии важных решений.
Конфиденциальность
Все обнаружение и преобразование выполняются локально в JavaScript после загрузки страницы. Никакой текст не отправляется на сервер для обработки.
Часто задаваемые вопросы
Что такое гомоглиф?
Гомоглиф — это символ, который выглядит как другой символ из другого алфавита или кодировки, например, кириллическая «а», напоминающая латинскую «a». Злоумышленники используют их в поддельных доменах, именах пользователей и сообщениях. Этот инструмент отображает эти символы с помощью кодовых точек и замен.
Чем это отличается от нормализации Unicode?
Нормализация Юникода (например, NFKC) стандартным образом сворачивает варианты совместимости и ширины. Этот инструмент сочетает в себе NFKC с небольшой явной запутанной картой, чтобы вы могли понять, почему был помечен каждый символ — полезно, помимо простого прохода инструмента нормализации Юникода.
Изменит ли строгий режим ASCII законный неанглийский текст?
Строгий резервный вариант ASCII заменяет символы, которые появляются в прилагаемой запутанной карте или изменяются в соответствии с NFKC. Другие буквы, отличные от ASCII, остаются без изменений. Допустимый текст все равно может измениться, если он содержит эти сопоставленные символы, поэтому просмотрите список анализа.
Отправлено ли мое сообщение на сервер?
Нет. После загрузки страницы для обнаружения и преобразования используется только JavaScript. Этот конвертер путаницы не загружает вашу пасту для анализа.
Сможет ли это уловить любую подделку?
Нет. Покрытие является детерминированным и основано на картах, а не на машинном обучении. Это помогает с обычными трюками с похожими персонажами, но не является полной проверкой безопасности.
Что делает режим «Создать гомоглифы»?
Он заменяет буквы и цифры ASCII во входных данных детерминированными аналогами из той же связанной карты, которая используется для очистки, что полезно для создания тестовых строк в авторизованных средах (например, при проверке качества модерации). Это не для выдачи себя за другое лицо или обхода защиты.