Компоновки фамилии, имени и отчества

Компоновка ФИО позволяет определить, какую информацию об обработанной фамилии, имени и отчестве следует выводить в отчетах. При обработке ФИО сервис дополнительно определяет пол персоны и ее этнический домен (национальность), поэтому в отчет кроме самой фамилии, имени и отчества можно выводить эти сведения в отдельных колонках.

Создание и управление компоновками ФИО выполняется в разделе личного кабинета Компоновки ФИО. Работа в данном разделе полностью аналогична работе с компоновками адресов, описанной в соответствующей статье. В качестве демонстрации рассмотрим создание компоновки для ФИО с нуля. В данном случае настроим вывод фамилии и имени персоны в одну общую колонку, а вывод отчества – в другую. Также в отдельные колонки выведем пол человека и его этнический домен. Понятие этнического домена весьма близко к понятию национальности, но, поскольку по написанию ФИО достоверно определить национальность конкретного человека не всегда возможно, сервис оперирует термином этнический домен, который следует понимать, как принадлежность персоны к вероятной этнической и языковой группе. Далее для простоты изложения термины национальность и этнический домен будем использовать в качестве синонимов.

Чтобы создать требуемую компоновку ФИО, необходимо нажать на кнопку «Создать новую пустую компоновку», находясь в разделе Компоновки ФИО, как это продемонстрировано на следующем рисунке.

Также как это делалось для компоновок адресов и телефонов, откроем редактор этой компоновки с помощью кнопки редактирования, обозначенной на рисунке выше.

В открывшемся редакторе зададим для этой компоновки название «Фамилия склеена с именем». После чего добавим первую колонку с помощью кнопки с изображением плюса.

Далее по аналогии с редактированием колонок, описанным для компоновок адресов и телефонов, добавим в созданную только что колонку два элемента – «Фамилию персоны» и «Имя персоны». После чего поменяем имя данной колонки с «Безымянная колонка 1» на «Фамилия и имя», поскольку данная колонка будет содержать два этих компонента ФИО. В результате этих действий компоновка должна принять следующий вид.

Далее аналогичным образом добавим три колонки для вывода отчества персоны, пола персоны и национальности соответственно. За вывод национальности персоны отвечает элемент «Этнический домен ФИО». В результате должны получить компоновку, изображенную на следующем рисунке.

Поскольку фамилия и имя выводятся в одну общую колонку, чтобы не происходило их склеивания, укажем в качестве разделителя между ними символ подчеркивания. В реальной жизни в качестве разделителя правильнее использовать пробел, однако в нашем вымышленном примере символ подчеркивания выбран для обеспечения большей наглядности.

Для этого откроем редактор элемента «Фамилия персоны» и в поле «Разделитель, если элемент не последний в колонке» поставим символ подчеркивания, как это продемонстрировано на следующем рисунке.

Отчет, содержащий результат стандартизации ФИО, отформатированных с использованием данной компоновки, будет иметь следующий вид.

Для наглядности первая колонка отчета содержит исходное имя и отчество, поскольку в исходном виде в реестре эти два компонента ФИО были сцеплены в рамках одной колонки. Во второй колонке приведена исходная фамилия, т.к. в реестре фамилия хранилась в отдельной колонке. Далее для наглядности выведена колонка с должностью персоны. Она взята из исходного реестра «как есть». А после нее выводятся колонки с результатом стандартизации ФИО.

Несмотря на то, что изначально имя и отчество были сцеплены в одну строку, в ходе стандартизации сервис отделил имя от отчества, благодаря чему появилась возможность скомпоновать фамилию и имя вместе, разделив их символом подчеркивания, как это было нами изначально задумано. Кроме того, в результате стандартизации сервис восстановил букву ё в имени Петр и в фамилии Семенова.

В следующей колонке выведено отдельно отчество. Хотя изначально отчество Сидорович было сцеплено с именем Петр, после стандартизации сервис отделил его от имени. Это позволило вывести отчество в отдельную колонку.

После отчества выведена колонка с полом персоны. Значение MALE указывает на мужской пол, значение FEMALE – на женский. В последней колонке, согласно нашей компоновке, сервис вывел этнический домен персоны.

При настройке компоновок ФИО важно иметь представление о том, какие вообще элементы стандартизованного ФИО можно включать в колонки итогового отчета. Все доступные в текущей версии сервиса элементы можно увидеть в выпадающем списке при попытке добавить очередной элемент в колонку, как это показано на следующем рисунке.

Этот список может расширяться по мере выхода новых версий нашего сервиса. В настоящий момент для включения в колонки отчета доступны следующие элементы ФИО.

  • Фамилия персоны – с помощью данного элемента в колонки отчета можно выводить нормализованную фамилию персоны.
  • Имя персоны – с помощью данного элемента в колонки отчета можно выводить нормализованное имя персоны.
  • Отчество персоны – с помощью данного элемента в колонки отчета можно выводить нормализованное отчество персоны.
  • Пол персоны – данный элемент позволяет выводить в отчет распознанный пол персоны.
  • Этнический домен – данная категория содержит элементы, позволяющие выводить в отчеты информацию о национальности персоны, полученную на основе анализа написания ФИО.
    • Этнический домен ФИО – национальность, общая для всех компонентов ФИО в комплексе. Этнические домены разных компонентов ФИО могут отличаться, например, имя персоны может быть русским, а фамилия – немецкой. При выводе этнического домена ФИО в целом происходит приведение доменов ее отдельных компонентов к наиболее близкому общему домену.
    • Этнический домен имени – этнический домен, распознанный в результате анализа имени персоны.
    • Этнический домен фамилии – этнический домен, распознанный в результате анализа фамилии.
    • Этнический домен отчества – этнический домен, распознанный в результате анализа отчества.
  • Показатели качества – данная категория позволяет выводить в отчет различные числовые характеристики, отражающие качество исходных данных. На основе значений этих показателей можно судить о достоверности информации, которую вернул сервис в результате стандартизации ФИО.
    • Совместимость компонентов ФИО по этническому домену – элемент, позволяющий вывести значение от 0 до 1, которое оценивает, насколько совпадают этнические домены имени, фамилии и отчества. Если домены имени, фамилии и отчества персоны совпадают, то данный показатель будет иметь значение 1. В противном случае, его значение будет меньше единицы. Например, для ФИО Себастьян Асатиани имя будет отнесено к испанскому домену, а фамилия – к грузинскому, в результате их совместимость будет оценена в районе числа 0.02. Данный показатель можно использовать, например, для нужд кредитного скоринга. Поскольку наличие у персоны нехарактерного сочетания имени и фамилии может вызывать дополнительные вопросы при выдаче микрозайма или кредита.
    • Точность распознавания – данный элемент выводит число от 0 до 100, которое показывает, пришлось ли в ходе обработки ФИО исправлять ошибки и неточности. Чем меньше ошибок и неточностей допущено при написании исходного ФИО, тем выше возвращаемое значение точности.
    • Полнота распознавания - данный элемент выводит число от 0 до 100, которое указывает на процент использования слов исходной записи при распознавании. Чем больше в исходной записи лишних неиспользованных слов, не участвующих в распознавании ФИО, тем меньше полнота.
  • Служебные данные – в данной категории представлены элементы служебного характера. В основном они могут быть интересны ИТ-специалистам. Состав данной категории эквивалентен одноименной категории, рассмотренной ранее в Компоновках адреса.
версия сервиса:
обработано за 1 (мс)