Недавнее исследование, проведенное в Йельском университете (Yale), показало, что анализ выбора слов человеком может служить предиктором ухудшения симптомов большого депрессивного расстройства. В рамках исследования использовались как оценщики-люди, так и большая языковая модель ChatGPT для оценки письменных ответов участников. Результаты демонстрируют, что оба метода демонстрируют высокую точность в прогнозировании тяжести депрессии через несколько недель после первичного тестирования.
Новое исследование: анализ выбора слов как предиктор ухудшения симптомов большого депрессивного расстройства
В исследовании приняли участие 467 человек, которые ответили на девять открытых нейтральных вопросов с короткими ответами. Дополнительно был проведен опросник о состоянии здоровья пациента (PHQ-9), который оценивает тяжесть депрессии. Участники повторно заполнили анкету PHQ-9 через три недели.
Инструменты анализа
Для анализа письменных ответов использовались два основных инструмента:
- Linguistic Inquiry and Word Count (LIWC) — инструмент, который подсчитывает количество слов, попадающих в определенные категории.
- ChatGPT — большая языковая модель, способная имитировать человеческую разговорную речь и учитывать порядок слов и значение фраз.
Результаты
LIWC
Анализ с использованием LIWC показал, что количество слов с положительным или отрицательным эмоциональным тоном коррелирует с тяжестью депрессии на момент ответа участников. Однако, LIWC не смог предсказать ухудшение симптомов депрессии через три недели.
Оценки людей
Оценки настроений, полученные от оценщиков-людей, напротив, точно предсказывали будущие изменения в степени тяжести депрессии. Это указывает на то, что человеческий фактор играет ключевую роль в интерпретации эмоционального тона текстов.
ChatGPT
При использовании ChatGPT версии 3.5 и 4.0 для оценки ответов участников, полученные оценки также предсказывали будущие изменения в тяжести депрессии, аналогично оценкам людей. Это открытие подчеркивает важность учета порядка слов и многомерного аспекта языка.
Обсуждение
Исследователи отмечают, что LIWC обрабатывает каждое слово индивидуально, что может быть недостаточным для полного понимания эмоционального тона текста. В отличие от этого, ChatGPT учитывает контекст и значение фраз, что делает его более подходящим для анализа языка.
Перспективы и заключение
Данное исследование является отправной точкой для дальнейших исследований в области взаимосвязи между языком и психическим здоровьем. Оно может открыть новые возможности для разработки автоматизированных инструментов оценки психического здоровья, которые могут дополнить и улучшить традиционные психологические методы диагностики и прогнозирования.
Исследователи подчеркивают важность комбинации различных инструментов и подходов для получения наиболее полной картины состояния пациента. Автоматизация некоторых аспектов анализа языка может позволить врачам уделять больше времени непосредственной помощи пациентам, что в конечном итоге способствует улучшению качества психиатрической помощи.
Литература.
“Language sentiment predicts changes in depressive symptoms” by Jihyun Hur et al. PNAS