names/README.md
2026-02-12 00:05:07 +04:00

914 B
Raw Blame History

База российских имен с полом, частотностью и сокращенными и уменьшительно-ласкательными формами

Имена взяты с analiz-imeni.ru

Частотность употребления (встречаемости) рассчитана на основе базы звонков крупного колл-центра исходя из количества обращений.

Словоформы имен получены с помощью GigaChat и валидированы нашей библиотекой семантического анализа Lexicon.

Поля:

  • name - основная форма имени

  • freq - частота встречаемости имени

  • gender - пол

  • form1 и form2 - дополнительные формы имени

Разделитель полей в csv - ";"