---
name: Russian Text Humanization
description: |
  Натурализация русскоязычного текста - убрать маркеры ИИ-генерации. Использовать когда:
  Хабр-статьи, блоги, маркетинг, любой русский текст который не должен читаться как ИИ.
  Покрывает: слова-маркеры, калькирование, канцелярит, ритм, отглагольные существительные.
  Источники: Liang et al. (arxiv 2406.07016), gramota.ru, Хабр 918226, Sber GigaCheck.
  Use BEFORE publishing any AI-generated Russian text.
---

# Натурализация русского текста

## Когда использовать

- Статьи на Хабр, блоги, маркетинговые тексты
- Полировка ИИ-черновиков до человеческого звучания
- Любой русский текст который не должен восприниматься как сгенерированный

## Главный принцип

**Специфичность против обобщённости.** Человек пишет конкретно: имена, даты, версии, личный опыт. ИИ пишет общо: покрывает все базы, хеджирует, использует самые частотные формулировки. "Гладко но пусто" - подпись ИИ.

## Слова-маркеры (ЗАПРЕЩЕНЫ)

### Tier 1 - Убить немедленно

| Маркер | Замена |
|--------|--------|
| является | тире или перефразировать ("X - это Y" или просто убрать) |
| выступает (в роли) | работает как, служит |
| играет важную/ключевую роль | важен для, влияет на |
| не просто..., а... | перефразировать напрямую (любимая конструкция ChatGPT) |
| мощный (инструмент/подход) | быстрый, удобный, рабочий - что конкретно мощного? |
| позволяет | можно, даёт, через X можно Y |
| обеспечивает | даёт, гарантирует, делает возможным |
| данный (подход/метод) | этот, или убрать |

### Tier 2 - Отглагольные существительные (deverbal nouns)

ИИ злоупотребляет ими. Заменять глаголами:

| Канцелярит | По-человечески |
|-----------|----------------|
| привлечение пользователей | привлекать пользователей / чтобы пришли пользователи |
| обеспечение качества | чтобы качество не падало / следить за качеством |
| тестирование функционала | тестировать фичи / гонять тесты |
| использование инструментов | пользоваться инструментами |
| осуществление перехода | перейти |
| проведение анализа | проанализировать / разобраться |

### Tier 3 - Фразы-индикаторы

| Убить | Почему | Замена |
|-------|--------|--------|
| Я надеюсь, это помогло Вам | чатбот-маркер | убрать |
| Конечно / Безусловно (в начале) | ChatGPT opening pattern | убрать |
| Вы абсолютно правы | подхалимаж чатбота | "да, верно" / "ок, принято" |
| По состоянию на [дата] | калька с английского "as of" | "на сегодня" / "сейчас" |
| Сообщите мне | калька "let me know" | "дай знать" / "напиши" |
| более подробный анализ | канцелярит | "разберу подробнее" |
| В заключение хотелось бы отметить | пустая связка | просто написать вывод |
| Стоит отметить, что | пустая связка | убрать, сразу к сути |
| Честный нюанс / Честный дисклеймер | LLM-конструкция, люди так не говорят | просто новое предложение с фактом, или `UPD:` |
| Важно понимать, что | LLM-преамбула | убрать, сразу к факту |
| Следует учитывать | канцелярит-LLM | убрать, сразу к факту |
| Необходимо отметить | канцелярит-LLM | убрать |
| Правда есть одно но | устаревшая письменная связка | просто новое предложение |
| Однако / Впрочем / Тем не менее | формальные коннекторы, в онлайн-тексте редко | новое предложение без связки |
| Стоит сказать / Надо сказать | LLM-преамбула | убрать, сразу к сути |

### Принцип: коннекторы не нужны

Современная письменная русская речь (Хабр, Telegram, чаты) упростилась. Вместо связок типа "правда", "впрочем", "стоит отметить" - просто новое предложение с фактом. Для явной вставки/поправки - `UPD:`.

**LLM:** "Спасибо за наводку, посмотрю. Честный нюанс: у меня managed-окружение, обновить не так просто."
**Человек:** "Спасибо за наводку, посмотрю. У меня managed-окружение, обновить не так просто."
**Человек (с явной вставкой):** "Спасибо за наводку, посмотрю. UPD: у меня managed-окружение, обновить не так просто."

---

## Структурные маркеры ИИ

### Порядок слов

Русский - язык со свободным порядком слов. ИИ калькирует английский SVO:

**ИИ (калька):** "Модель обеспечивает высокое качество обработки."
**Человек:** "Качество обработки у этой модели - огонь." / "Обрабатывает она, надо сказать, отлично."

### Предложения

- ИИ: все предложения средней длины, максимум 2 части в сложном
- Человек: от 3 слов до 40, вложенные придаточные, причастные обороты, иногда обрывает мысль

### Абзацы

- ИИ: одинаковой длины, каждый начинается с отглагольного существительного + двоеточие
- Человек: один абзац - одно предложение, следующий - пять. Неравномерно

### Логика

- ИИ: абзацы можно переставить без ущерба для смысла (нет логической цепочки)
- Человек: каждый следующий абзац вытекает из предыдущего, есть внутренняя аргументация

### Дополнительные паттерны ИИ (из Wikipedia "Признаки сгенерированности текста")

| Паттерн | Пример | Исправление |
|---------|--------|------------|
| **Правило трёх** - триады прилагательных | "яркий, богатый, разнообразный" | Убрать до одного точного слова |
| **Ложный диапазон** (мерисм) | "от лёгкого до тяжёлого" | Конкретное значение вместо range |
| **Замена имени синонимом** | "данный специалист", "вышеупомянутый проект" | Просто повторить имя/название |
| **Безымянные эксперты** | "по словам экспертов", "исследования показывают" | Конкретная ссылка или убрать |
| **Проблема → вагонный оптимизм** | "Несмотря на проблемы, перспективы выглядят многообещающе" | Конкретный прогноз или честное "не знаю" |
| **Определение в начале** | "X - это..." как первое предложение | Начать с контекста, проблемы, истории |
| **Рекламные кластеры** | "потрясающая природная красота", "богатое культурное наследие" | Конкретный факт |
| **Капитализация заголовков** | "Как Правильно Настроить Конфиг" (English style) | По-русски: только первое слово с большой |

---

## Стилистические маркеры

| Маркер ИИ | Что делает человек |
|-----------|-------------------|
| Канцелярский язык | Живая речь, разговорные элементы |
| Идеальная пунктуация | Стратегические "ошибки", разговорный стиль |
| Повтор мыслей разными словами | Новая информация в каждом предложении |
| Обезличенность | Субъективность, "я думаю", "мне кажется" |
| Равномерное распределение акцентов | Фокус на главном, проскакивание второстепенного |
| Отсутствие юмора | Ирония, самоирония, неожиданные сравнения |

---

## Разговорные элементы (добавлять)

Человек пишет с разговорными вкраплениями даже в техническом тексте:

- **Частицы:** ну, вот, кстати, вообще-то, правда, ведь, же
- **Вводные:** короче, в общем, допустим, грубо говоря, если честно
- **Оценочные:** нормально, ок, фигня, круто, дичь
- **Самокоррекция:** "хотя нет, подождите...", "ну точнее не совсем так..."
- **Риторические вопросы:** "А смысл?", "И что?", "Знакомо?"

**Дозировка:** 1-2 разговорных элемента на 500 слов. Больше - развязно. Меньше - стерильно.

---

## Техники для технических статей

1. **Начинать с проблемы которая была у тебя лично**, не с обзора темы
2. **Включать тупики** - "Я попробовала X, не сработало потому что..."
3. **Показывать реальные error messages**, stack traces, версии
4. **Свои цифры** - "заняло 47 минут на моём MacBook M1"
5. **Конкретные инструменты с версиями** - не "популярный фреймворк"
6. **Не соглашаться с чем-то** - занять позицию
7. **Признавать что не понимаешь** - "честно, я до сих пор не понимаю зачем тут..."
8. **Код из реального проекта**, не generic примеры
9. **Упоминать время** - "в 2 ночи я поняла что..."
10. **Скриншоты своего терминала/IDE**, не стоковые

---

## Чеклист перед публикацией

- [ ] Нет "является" нигде в тексте
- [ ] Нет калькированного порядка слов (перечитать вслух)
- [ ] Нет цепочек отглагольных существительных
- [ ] Есть разговорные элементы (ну, вот, кстати, вообще-то)
- [ ] Нет "не просто..., а..." конструкции
- [ ] Есть авторская интонация и мнение
- [ ] Длины предложений скачут (3 слова рядом с 30)
- [ ] Длины абзацев неравномерные
- [ ] Хотя бы 1 признание незнания / неуверенности на 500 слов
- [ ] Хотя бы 3 конкретных числа / даты / версии на статью
- [ ] Хотя бы 1 тупик / неудача ("пробовала X - не сработало")
- [ ] Нет симметричных списков (все пункты одной длины)
- [ ] Абзацы нельзя переставить без потери смысла

---

## Отличия от английского

| Аспект | Английский | Русский |
|--------|-----------|---------|
| Порядок слов | SVO фиксирован, не маркер | Свободный, SVO = подозрительно |
| Морфология | Бедная, не детектится | Богатая, ИИ упрощает формы |
| Отглагольные | Норма | Сильный сигнал ИИ |
| Связка "to be" | Нормально | "является" = красный флаг |
| Калькирование | Нет проблемы | Структуры "переведённые с английского" |
| Грамматические ошибки | Мало у людей | Люди допускают в разговорном стиле |

---

## Источники

### Академические
- Liang et al. (2024) - arxiv 2406.07016 - 15M+ абстрактов, 280 excess words (принципы применимы к русскому)
- Human-LLM Coevolution (arxiv 2502.09606) - маркеры меняются со временем

### Русскоязычные
- gramota.ru - признаки ИИ-сгенерированного русского текста
- Хабр (habr.com/ru/articles/918226/) - 14 признаков + чеклист гуманизации
- Русская Википедия - "Признаки сгенерированности текста"
- Sber GigaCheck (developers.sber.ru) - ИИ-детектор для русского, 94.7% accuracy