Терри Пратчетт написал 41 роман о Плоском мире. Миллионы слов, десятки персонажей, тридцать с лишним лет непрерывной работы. Каждая книга – пародия, притча и философский трактат одновременно, замаскированные под комическое фэнтези. Но в январе 2026 года группа исследователей из Кардиффского университета, Лафборо и Оксфорда опубликовала в журнале Brain Sciences работу, которая обнаружила в этих текстах ещё одну историю. Историю, которую сам Пратчетт не знал, что рассказывает. Историю болезни.
Учёные прогнали 33 романа серии через лексический анализ – и нашли маркеры деменции почти за десять лет до того, как Пратчетту поставили официальный диагноз.
Человек, который смеялся над Смертью
Для тех, кто не читал Пратчетта, – короткий контекст. Плоский мир (Discworld) – это фэнтезийная вселенная, где Смерть говорит ЗАГЛАВНЫМИ БУКВАМИ и увлекается кошками, а библиотекарь Незримого Университета – орангутан. Пратчетт начал серию в 1983 году романом «Цвет волшебства» и продолжал до 2015-го, когда вышел посмертный «Пастуший венец». В промежутке – Букеровская номинация, рыцарство, продажи свыше 85 миллионов экземпляров и, по сути, изобретение целого поджанра: умного, ироничного, социально заряженного фэнтези.
В декабре 2007 года, в возрасте 59 лет, Пратчетту диагностировали заднюю корковую атрофию (posterior cortical atrophy, PCA) – редкую форму болезни Альцгеймера, которая поражает зрительные и пространственные отделы мозга. Он немедленно окрестил диагноз «embuggerance» – на русский это можно перевести как «чёртова напасть» – и не замолчал. Напротив, стал одним из самых заметных публичных защитников финансирования исследований деменции, пожертвовал миллион фунтов фонду Alzheimer’s Research UK и продолжал писать. PCA била по зрению, а не по речи – он не мог печатать, но мог диктовать. Последние романы создавались именно так: голосом, через помощника.
Он снялся в двух документальных фильмах BBC о жизни с деменцией, выступал перед парламентом, требовал права на эвтаназию – и до последнего вставлял в романы сноски, настолько остроумные, что критики не верили в диагноз. В марте 2015-го он умер. Ему было 66.
Что алгоритмы увидели в текстах Пратчетта
Мелоди Паттисон, Ахмет Бегде и Том Уилкоксон задали, в общем, простой вопрос: можно ли обнаружить следы когнитивного снижения в текстах Пратчетта ещё до диагноза? Для этого они взяли 33 романа Discworld (исключив восемь – детские книги и короткие повести, чтобы не искажать статистику) и загрузили их в корпусно-аналитическую платформу SketchEngine.
Ключевая метрика – так называемый type-token ratio (TTR), коэффициент лексического разнообразия. Если грубо: сколько уникальных слов приходится на общее количество слов в тексте. Считали отдельно для существительных, глаголов, прилагательных и наречий.
Результаты оказались довольно отчётливыми. Во всех классах слов TTR снижался с возрастом автора, но сильнее всего – у прилагательных. Точнее, прилагательные показали наивысшую диагностическую точность: площадь под ROC-кривой составила 0,91 (p < 0,001), чувствительность – 76%, специфичность – 100%. Другими словами, разнообразие описательных слов – тех самых, что придают прозе цвет, фактуру, эмоциональную глубину – падало раньше и заметнее всего.
Исследователи определили пороговое значение: TTR прилагательных ниже 0,227. И вот что интересно. Первым романом, оказавшимся за этой чертой, стал «Последний континент» (The Last Continent, Discworld #22), опубликованный в мае 1998 года. Это – 9 лет и 7 месяцев до официального диагноза. Все книги, написанные после «Последнего континента», оказались ниже порога. Все написанные до него – выше. Два романа, вышедших сразу после, балансировали на грани: TTR прилагательных 0,228, ровно на 0,001 выше отсечки.
Ещё один парадокс: объём книг рос. Средний объём романа до «Последнего континента» – примерно 87 тысяч слов. После – около 116 тысяч. Больше слов, но меньше разнообразия. Мозг способен на удивительные компенсаторные механизмы – и здесь он, если угодно, компенсировал сужение словаря увеличением потока. Как отметила доктор Паттисон: «Обычно мы ожидаем снижения лексического разнообразия по мере увеличения объёма текста, но даже после контроля длины наши результаты оставались значимыми. Сдвиги в языке – не то, что заметил бы читатель, скорее постепенное, прогрессирующее изменение». Исследователи проверили это отдельно, рассчитав MATTR (moving average type-token ratio) – нормализованный показатель, учитывающий длину текста. Различия остались статистически значимыми по всем категориям (p < 0,001).
Не только Пратчетт
Если бы это был единичный случай, его можно было бы списать на совпадение. Или на эволюцию стиля, или на возраст, или на что угодно. Но Пратчетт – не первый.
В 2005 году Питер Гаррард с коллегами опубликовал в журнале Brain анализ романов Айрис Мёрдок – одной из крупнейших британских писательниц XX века. Мёрдок публиковала романы почти полвека, и качество держалось стабильно – вплоть до последнего. «Дилемма Джексона» (1995) критики встретили с недоумением: проза казалась простоватой, словарь – беднее обычного. Вскоре у Мёрдок выявили болезнь Альцгеймера, подтверждённую гистологически после смерти в 1999 году. Текстовый анализ показал: лексическое разнообразие в последнем романе было значимо ниже, чем в ранних и средних работах. Синтаксис при этом почти не пострадал. Семантика сдала раньше грамматики.
В 2009 году Иэн Ланкашир и Грэм Хёрст из Университета Торонто проделали ту же процедуру с Агатой Кристи. Кристи так и не получила формального диагноза деменции, но о её когнитивном угасании в последние годы жизни известно из мемуаров и свидетельств близких. Лингвистический анализ 16 романов, написанных с 28 до 82 лет, выявил статистически значимое сокращение словарного запаса, рост повторяющихся фразеологических оборотов и увеличение неопределённых существительных – всё это типичные маркеры затруднений с извлечением слов из памяти.
В 2011 году Сюан Ле и тот же Хёрст расширили выборку: сравнили Мёрдок и Кристи с Ф.Д. Джеймс – детективщицей, которая писала до 88 лет без признаков когнитивного снижения. У Джеймс лексическое разнообразие оставалось стабильным на протяжении всей карьеры. У Мёрдок и Кристи – падало. Причём у Мёрдок дефициты проявились уже в конце сороковых – начале пятидесятых, за десятилетия до диагноза.
Три автора – разные эпохи, разные жанры, разная стилистика. Но паттерн один: язык начинает сужаться задолго до того, как болезнь становится очевидной для окружающих. Литература, сама того не подозревая, оказалась дневником когнитивного здоровья.
От романов – к речам и соцсетям
Писатели – удобный объект для исследования, потому что оставляют много текста. Но метод работает шире.
В 2020 году команда из Стивенсовского технологического института проанализировала публичные речи Рональда Рейгана за десять лет – с 1980-го по 1989-й. Рейган получил диагноз «болезнь Альцгеймера» только в 1994-м, через пять лет после ухода с поста. Но алгоритмы машинного обучения, натравленные на лингвистические биомаркеры его речей, обнаружили аномалии уже в период между 1983 и 1987 годами. Другими словами – ещё в разгар президентства.
Есть и более поразительный пример. «Исследование монахинь» (Nun Study) – масштабный лонгитюдный проект, начатый эпидемиологом Дэвидом Сноудоном в 1986 году. 678 католических монахинь конгрегации «Школьные сёстры Нотр-Дам» согласились на посмертное исследование мозга и предоставили доступ к своим личным документам. Среди этих документов нашлись автобиографические эссе, написанные при вступлении в орден – в среднем в 22 года.
Сноудон измерил «лингвистическую плотность» этих текстов – количество идей на предложение. Результат поражал: тексты с низкой плотностью идей, написанные в молодости, предсказывали болезнь Альцгеймера десятилетия спустя с точностью 80–90%. Не генетика, не образ жизни, не питание – сочинение, написанное в двадцать два года.
По сути, исследование монахинь показало то же самое, что литературные анализы, только с другого конца. У писателей язык начинает сужаться по мере приближения болезни. У монахинь низкая языковая сложность в юности оказалась маркером уязвимости, которая реализуется десятилетия спустя. В обоих случаях текст оказывается слепком нейрокогнитивного состояния – вне зависимости от того, знает ли об этом его автор.
Как ИИ ищет деменцию в речи
От ретроспективного анализа литературных произведений до реального скрининга – один технологический шаг. И этот шаг уже делается.
В 2025 году сразу несколько исследовательских групп опубликовали работы по автоматическому обнаружению когнитивных нарушений через анализ речи. Платформа SpeechCARE, описанная в npj Digital Medicine, использует мультимодальные трансформеры для классификации деменции и лёгких когнитивных нарушений на основе коротких речевых записей – та же самая платформа, которую её создатели представили на конкурсе PREPARE, организованном Национальным институтом старения США специально для поиска речевых маркеров когнитивного снижения. Параллельная работа в Communications Medicine – модель Random Forest, обученная на базе DementiaBank (291 запись), – показала специфичность 83% и чувствительность 69% при обнаружении деменции по лингвистическим признакам устной речи. Причём систему валидировали на независимой выборке, включавшей неносителей английского. А проект CognoSpeak из Шеффилдского университета и вовсе предлагает дистанционную оценку: пациент разговаривает с виртуальным интервьюером через браузер, и система анализирует речь в реальном времени.
Что тут нового по сравнению с анализом Пратчетта или Кристи? Масштаб. И скорость. Те исследования требовали ручной загрузки целых корпусов текстов и кропотливого лингвистического разбора. Современные системы обрабатывают минуты речи или абзацы текста и выдают оценку риска. Ищут они, по сути, те же вещи, что нашли у Пратчетта, только обобщённые на устную речь: больше местоимений вместо конкретных существительных, больше слов-паразитов, больше пауз хезитации, меньше аналитических конструкций, ниже лексическое разнообразие. Отдельные модели учитывают и акустику – изменения в тоне голоса, темпе, артикуляции. Некоторые работают с данными стандартных нейропсихологических тестов – описание картинки Cookie Theft, фонемическая беглость. Другие пытаются извлекать маркеры из обычного разговора. Это один из случаев, когда искусственный интеллект не пугает, а помогает.
И вот почему это стало особенно актуально. За последние два года появились первые препараты, которые не просто снимают симптомы Альцгеймера, а пытаются замедлить саму болезнь. Леканемаб и донанемаб – антитела, нацеленные на амилоидные бляшки в мозге. Клинические испытания показали: эти лекарства наиболее эффективны на ранних стадиях, до того как нейронные повреждения стали необратимыми. Проблема в том, что «ранняя стадия» – это ещё и стадия, которую нынешние методы диагностики часто пропускают. Человек чуть реже подбирает нужное слово, чуть чаще повторяется, чуть беднее описывает картинку – и ни он сам, ни окружающие не замечают. А языковой анализ – замечает.
Текст как биомаркер деменции
Здесь стоит оговориться: лингвистический анализ – не диагноз. Сами авторы исследования Пратчетта подчёркивают это прямо. Пороговые значения TTR откалиброваны под конкретного автора с конкретным базовым словарём и конкретным жанром. Они не переносятся напрямую на популяцию. Образование, профессия, привычки письма, родной язык – всё это влияет на языковой профиль. Человек, который всю жизнь пишет техническую документацию, и человек, который ведёт блог о путешествиях, будут показывать совершенно разные базовые значения.
Но – и это существенно – метод персонализированного мониторинга не требует сравнения с популяцией. Он сравнивает человека с самим собой. Если ваш словарь устойчиво сужается, если частота повторов растёт, если синтаксическая сложность падает – это сигнал. Возможно, ложный. Возможно, вызванный стрессом или усталостью. Но сигнал, который стоит проверить клинически.
Данные для такого мониторинга, по сути, уже существуют. Электронная почта, мессенджеры, рабочие документы, посты в соцсетях – всё это цифровой языковой след. Исследователи из Imperial College London прямо указывают, что их модель задумана как инструмент триажа – первичной сортировки пациентов по уровню риска, а не как замена врачу. При адекватном согласии и защите приватности (а это, разумеется, отдельная и непростая задача) такой след мог бы стать материалом для скрининга, который не требует ни визита к врачу, ни анализа крови, ни МРТ. Здесь, впрочем, проходит тонкая грань: одно дело – приложение, которое ты скачиваешь добровольно и получаешь результат на свой телефон. Совсем другое – работодатель или страховая компания, анализирующая твою переписку без ведома. Вопрос о том, кому принадлежат наши цифровые данные, здесь стоит особенно остро.
Что рассказал Плоский мир
Пратчетт не знал, что «Последний континент» – его двадцать второй роман, вышедший в 1998 году – станет линией разлома. Он продолжал писать ещё девять лет до диагноза и ещё семь после него. Плоский мир рос, персонажи усложнялись, сюжеты переплетались. Читатель ничего не замечал. Но алгоритм, считающий отношение уникальных прилагательных к общему числу прилагательных, – заметил.
Наверное, в этом есть что-то одновременно тревожное и обнадёживающее. Тревожное – потому что болезнь работала тихо, под поверхностью, пока автор и его миллионы читателей были уверены, что всё в порядке. Обнадёживающее – потому что метод, который это обнаружил, применим не только к знаменитым писателям. Он применим к любому, кто оставляет текстовый след.
Пратчетт любил напоминать, что в Плоском мире Смерть – не злодей. Скорее наблюдатель, делающий свою работу с профессиональной добросовестностью. Болезнь Альцгеймера – не такая. Она не даёт предупреждений и не соблюдает правил. Но, похоже, она оставляет следы в словах – тех самых, которые мы роняем каждый день, не задумываясь. И если наука продолжит учиться слушать – не что мы говорим, а как мы это делаем – это может помочь миллионам узнать раньше. Не постфактум, не из трогательного некролога. А вовремя.
Нет, лингвистический анализ – это инструмент скрининга, а не клинический диагноз. Пороговые значения откалиброваны под конкретного автора и не переносятся на популяцию. Однако устойчивое снижение лексического разнообразия – сигнал, который стоит проверить у специалиста.
Основные маркеры: снижение разнообразия прилагательных, рост повторов, упрощение синтаксиса, замена конкретных существительных неопределёнными местоимениями, увеличение пауз и слов-паразитов в устной речи.



