Я думаю, многим читателям, глядя на окружающее нас общество, трудно избавиться от ощущения, что когда-то в прошлом что-то пошло не так. Мир перестал быть прогрессивным, уютным и «ламповым», зато стал холодным, тревожным, несправедливым и консервативным. Трудно понять, является это объективным свойством нашего мира или же следствием нашего субъективного восприятия реальности. Группа голландских и американских исследователей попыталась разобраться в том, имел ли место этот слом в общественном устройстве или сознании, и если имел, то когда он произошел и почему. Они использовали базу данных Google Ngrams, в которой собрана информация о частоте использования различных слов и понятий в литературном языке за последние полтора столетия (исследование касалось в первую очередь английского и испанского). Ученых интересовали глобальные изменения в частоте использования слов, ассоциирующихся с рациональным или эмоциональным восприятием мира, а также с индивидуальным или коллективистским восприятием социума. Им удалось обнаружить, что на протяжении более чем ста лет с 1850 года (со времен расцвета Промышленной революции) эмоциональное и индивидуалистское начало в литературном языке постепенно вытеснялось рациональным и коллективистским. Однако примерно полвека назад произошел резкий разворот, и в современном языке субъективная оценка реальности снова начала преобладать, причем в последние полтора десятилетия процесс замещения рационального эмоциональным в языке резко ускорился. Авторы связывают такой переход от рационального к эмоциональному с наступлением на Земле эпохи постправды.
Введение, где говорится о русской литературе, культуре хиппи и саморазвитии
Известный русский писатель В. Г. Короленко, рассуждая о тяжелом для прогрессивной русской интеллигенции времени (конце 80-х годов XIX столетия), отмечал, что одной из характерных черт той эпохи явилось переключение интересов мыслящих людей с вопросов общественных на вопросы частные и личные. «Началось, — пишет он, — самоуглубление, самоусовершенствование (так и хочется добавить «саморазвитие» — М. Г.), решение вопросов изолированной личности, вне связи с общественными вопросами, до тех пор властно занимавшими умы и сердца». А еще одни замечательный автор, Глеб Успенский, остроумно называл подобное умонастроение: «Восемьдесят тысяч верст вокруг самого себя».
Много времени спустя в документальном фильме «Гипернормализация» британский журналист Адам Кёртис сходным образом опишет разочарование, постигшее в середине 1970-х американских левых интеллектуалов после того, как все их попытки организовать мирную революцию потерпели крах. Это «было возникновение нового мощного индивидуализма, который плохо сочетался с идеей коллективных политических действий», — отмечает он. Действительно, 60-е и 70-е кончались. На смену длинноволосым хипарям приходили ухоженные яппи, на смену наивным бунтарям — не менее наивные конформисты, на смену free love — корпоративная этика, на смену актам гражданского неповиновения, интернационализму, коммунизму, Марксу, Че Геваре и социальным утопиям шли глобализм, толерантность, принцесса Диана и грамотная маркетинговая политика. А там совсем невдалеке уже маячили и постправда, и кромешный кешбэк, и беспросветный tax return, и травоядный интернет, и ханжество, и личное пространство, и назойливая забота государства о нашей безопасности, от которой становилось всё тяжелей и тяжелей убежать.
Я не зря нанизывал тут длинные «бусы» слов и понятий, шедших на смену друг другу. Социальные изменения очень плохо поддаются строгому научному описанию. Едва ли у социологов существуют специфические маркеры индивидуализма и коллективизма, трезвой рациональности и эмоциональной субъективности людей, но вот язык зачастую выдает нас. Те понятия, которыми мы оперируем, те мысли, которые мы выражаем, те идеи, которые мы вычитываем из книг и газет, оформлены в слова, и по распространенности этих слов в разные эпохи можно хотя бы косвенно судить о том, какие вопросы занимали людей в то или иное время.
Немного о методах, или Почему авторы исключили из исследования слово «война»
Группа исследователей из Нидерландов использовала базу данных Google Ngram Viewer, чтобы оценить, как менялась частота употребления слов за последние полтора с лишним столетия. В базе собраны слова и короткие словосочетания, использованные в книгах с 1850 года по наши дни, а также информация о том, как часто они употреблялись писателями. Основной упор авторы работы, опубликованной в журнале PNAS, сделали на английский и испанский языки, выборки для которых составляли по 5000 слов, но авторы проверили и то, сохраняются ли обнаруженные ими тренды в других больших языках, включая русский. Разумеется, авторы не стремились рассматривать каждое слово отдельно (хотя в качестве иллюстраций некоторые слова подходят хорошо). Фокусировка на отдельных словах чревата практикой «снятия сливок» (cherry picking) с больших и очень разнородных данных: имея в запасе большое число слов, авторы всегда смогут неслучайно выбрать из них сколько-то десятков или сотен, чтобы подтвердить самую завиральную теорию (например, что с течением времени частота употребления слов на букву «а» растет). Чтобы избежать подобного самообмана, авторы статьи решили вначале пойти по пути обработки больших данных.
Они взяли список из 5000 самых распространенных в английской и испанской литературе слов, после чего убрали из этого списка слово «война» (см. дополнительные материалы к обсуждаемой статье). Звучит в стиле старых добрых «шестидесятых» (или новых добрых 2020-х), но на деле авторов смущало то, как сильно колебалась частота использования этого слова в течение XX столетия, в котором оно было актуально, прямо скажем, всегда, но в некоторые периоды времени — особенно. Данные по остальным словам обрабатывались следующим образом. Вначале, чтобы компенсировать увеличение числа текстов в базе данных со временем (в конце XX века выпускалось больше книг, чем в середине XIX-го, а их качество база данных не учитывала), встречаемость каждого слова делили на встречаемость артикля «an» в английском языке и «la» — в испанском. Затем для каждого слова рассчитывали z-оценку (не ищите здесь никакого подтекста!). Другими словами, частоту его употребления центрировали, а потом делили на стандартное отклонение. Это только звучит страшно, а на деле эту математическую операцию может совершить любой школьник.
Центрировать — значит вычесть среднее значение. Скажем, если слово встречалось в 2000-м, 2001-м и 2002-м годах соответственно 5, 10, 15 раз, то результатом центрирования будут значения −5, 0, 5. В качестве бонуса мы получаем возможность судить о том, в какие годы интересующее нас слово встречалось чаще, чем в среднем за всё время, а в какие — реже. Деление на стандартное отклонение позволяет абстрагироваться от абсолютных различий во встречаемости слов и абсолютных значений их изменчивости. Для примера предположим, что мы представили некоторые данные в километрах и в сантиметрах. Абсолютные значения изменчивости будут больше во втором случае, но… ведь это одни и те же данные. Деление же на стандартное отклонение позволяет перейти к более похожим шкалам измерений.
Вы спросите, зачем это делать в случае со словами, ведь данные о частоте их встречаемости очень важны. Это несомненно так, но, во-первых, использование z-оценок позволяет получить куда более «причесанные» данные, которые легче сравнивать на глаз и представлять на графиках (рис. 2).
Во-вторых, центрирование является обязательным, а деление на стандартное отклонение желательным элементом следующего этапа анализа данных — использования метода главных компонент (МГК, см., например, обсуждение здесь). О нем, пожалуй, я не буду рассказывать подробно, иначе моя статья стала бы бесконечной. Здесь же скажу только, что этот метод используется для работы с многомерными данными, где есть много переменных, некоторые из которых коррелируют друг с другом. Например, МГК часто используют экологи, изучающие влияние большого числа различных биотических и абиотических факторов на сообщество видов в какой-то экосистеме. В случае, который мы обсуждаем, переменных было 5 тысяч (по числу слов), а вообразить и обработать 5000-мерный график или 5000×(5000−1)/2 графиков обычный человеческий мозг не в состоянии. МГК позволяет, если повезет, перейти к куда меньшему числу измерений (собственно, главных компонент), потеряв при этом часть информации, но получив приемлемую для дальнейшего анализа картину.
Иногда для полученных компонент (то есть фактически осей нового графика) даже удается придумать разумные интерпретации. Пускай ни одну из них нельзя строго приравнять к конкретному фактору, но можно оценить, насколько сильно она коррелирует с каждым из них и насколько сильно она от него зависит. Иногда это бывает очень полезно в разведочном анализе данных. Именно для этого авторы статьи и использовали МГК, пытаясь в самом общем виде понять, как менялась частота использования слов с той или иной смысловой нагрузкой за последние полтора столетия. Затем они проверяли эти грубые прикидки, используя заранее определенные наборы слов и понятий (см. ниже).
Важно понимать, что МГК чувствителен к абсолютным значениям изменчивости в выборках, то есть данные в сантиметрах будут для него значить больше, чем те же данные в километрах. Частота употребления многих слов варьирует, скажем так, по внешним, имеющим очень слабое отношение к внутреннему миру людей причинам, а именно внутренний мир в каком-то смысле больше всего интересовал авторов статьи. Типичный пример таких причин — войны или экономические кризисы, приводящие к частому употреблению слова «война» или «кризис» в художественных и научных текстах. Получение z-оценок позволило несколько уменьшить вклад этой вызванной внешними причинами вариации в последующий анализ.
О гипотезах, вере и блондинках, или Не все слова одинаково приятны
Прежде чем двинуться дальше, давайте обсудим, какие именно гипотезы проверяли авторы. Мы все знаем, что слова — это не просто слова. Они имеют некоторый смысл. И мы даже способны слова классифицировать. Так, некоторые из них обладают негативной окраской (например, «пытка» или «изнасилование»), другие позитивной (например, «оргазм» или «мерло»), третьи используются для описания чувств и эмоций («бог», «любовь», «вера», «вкуснятина»), четвертые имеют отношение к рациональному мышлению («наука», «технология», «определение»). Наконец, есть слова, которые прочно ассоциируются с коллективистским или индивидуалистским взглядом на мир («мы»/«я»). Понятно, что такое деление в достаточной степени условно, но трудно спорить с тем, что слова «вздернутый», «капризный» или «блондинка» гораздо чаще встречаются в текстах, перегруженных эмоциональным содержанием, чем слова «доказательство», «теорема» или «индустриализация».
Для английского языка существуют списки, в которых слова ранжированы по их эмоциональной привлекательности или яркости эмоциональной окраски (любопытный читатель может найти пример такого списка и узнать, как он составлялся, в статье M. M. Bradley, P. J. Lang, 1999. Affective Norms for English Words (ANEW): Instruction Manual and Affective Ratings). Понятно, что такие перечни создаются людьми и не являются абсолютным мерилом привлекательности того или иного понятия, но, учитывая, что список слов был составлен независимо от обсуждаемой нами работы, можно смириться с его использованием в социологическом исследовании. К тому же разумных альтернатив всё равно нет. Ну можно не изучать связь языка и социума, но разве кому-то от этого будет веселее?
Так или иначе, можно высказать предположение, что использование слов с более яркой эмоциональной окраской свидетельствует о менее рациональном и более чувственном восприятии мира автором того или иного текста. Исследователи также оценивали распространенность рациональных/эмоциональных понятий в текстовых документах, составив (до анализа данных) списки слов, имеющих отношение к интуитивному или научному подходу к познанию мира. Эти списки они дополнили с помощью ресурса relatedwords.org, где можно искать понятия, ассоциирующиеся с неким словом, но не синонимичные ему. Опять же, метод не лишен изъянов, но список слов, которые получили авторы, производит неплохое впечатление с точки зрения здравого смысла. Аналогично они поступали и с понятиями, имеющими отношение к общественному и индивидуалистическому взгляду на мир. Поскольку язык художественной литературы может отличаться от языка литературы нехудожественной (non-fiction), то авторы рассматривали эти категории как вместе, так и по отдельности. Кроме того, они анализировали газетные тексты, взяв New York Times за образец некнижного языка.
Авторы предполагали обнаружить долговременные и противоположные тренды в относительной частоте использования эмоциональных и рациональных слов и понятий. Кроме того, они предположили, что эти изменения будут похожи на изменения в распространенности индивидуалистских и коллективистских слов и понятий.
Эпоха алогичности
Мне кажется, что это не самое худшее название для раздела, где рассказывается о полученных авторами статьи результатах, поскольку результаты эти весьма симптоматичны.
Первые две главные компоненты, то есть оси, полученные с помощью метода МГК, объясняли примерно 3/4 от всей вариации в изменении частоты употребления слов со временем. Иначе говоря, эти две оси сохраняли существенную часть информации по сравнению с 5000-мерным графиком. Как я уже предупреждал, интерпретация этих новых осей — штука довольно хитрая, но авторы рассудили следующим образом: первая компонента, монотонно уменьшающаяся со временем, отражает общую тенденцию к «устареванию» слов. На одном конце этой оси оказались различные архаичные понятия, например, «карета», а на другом более новые, например, «кола». Вторая ось оказалась еще более любопытной. На одном ее конце (назовем его положительным, хотя в данном случае знак не несет смысловой нагрузки) расположились слова, имеющие отношение к субъективному, сугубо личностному восприятию реальности, а на противоположном — понятия, связанные с общественной жизнью. Кроме того, эта ось очень сильно коррелировала с яркостью эмоциональной окраски слов. Другими словами, на одном ее конце находились слова, вызывающие у людей более эмоциональную субъективную реакцию, а на другой — слова, ассоциирующиеся с более рациональным и сдержанным восприятием мира.
На протяжении всей второй половины XIX-го и большей части XX века доля рациональных понятий в книжном языке стабильно росла, в то время как частота эмоциональных оценок столь же стабильно падала. Перелом случился где-то на рубеже 1970–1980-х годов, когда тренд развернулся, причем довольно резко. Авторы не пишут об этом напрямую, но я рискну предположить, что перелом наметился еще раньше. Возможно, именно наметившийся еще в 1970-е годы кризис левых идей на Западе породил тот самый запрос на индивидуализм, о котором я упоминал во введении в статью. Все-таки в докомпьютерную эпоху издание книг занимало несравнимо больше времени, публика не так быстро меняла свои вкусы, а авторы — убеждения. Так или иначе, доля рациональных понятий в книжном языке стабильно, но относительно медленно падала почти три десятилетия, после чего, примерно в 2007 году, случился резкий обвал, и процесс замены медленных и рациональных суждений на эмоциональные и необдуманные (или быстрые, если угодно) резко ускорился.
Параллельно с ростом эмоциональности в языке шел и рост индивидуалистического мышления в ущерб коллективистскому. Так, по крайней мере, интерпретируют свои результаты авторы. Например, с 1980-х годов в текстах начала уменьшаться доля личных и притяжательных местоимений множественного числа и расти доля местоимений числа единственного: I, me, mine. Кажется, еще Джордж Харрисон писал об этом, наблюдая, как лидеры группы «Битлз» начинают тянуть одеяло на себя.
Причины, следствия, постправда и робкая надежда в конце…
О причинах языкового перелома, случившегося в 1980-е годы, можно долго дискутировать, и авторы признают, что вопрос этот сложный. Кризис левых идей — это моя теория, а сами авторы выражаются довольно расплывчато. Возможно, сказывается то, что обсуждение учеными сугубо политических вопросов в последнее время несколько табуировано (то ли дело в старые добрые времена!). Мне даже трудно перевести связно то, что написали авторы. Что-то вроде того, что причиной произошедших глобальных изменений в языке могут быть «противоречия, возникающие из-за противопоставления неолиберальной политики, которую ее адепты защищают с помощью рациональных аргументов, и реальности, в которой самые сочные плоды экономического роста пожинает относительно небольшая прослойка общества». Мне кажется, что сказать «кризис левых идей» — куда короче.
Объяснить резкое ускорение процесса иррационализации языка в конце 2000-х годов проще. Во-первых, немного изменилась сама методика сбора данных для базы ngrams. Давайте не будем много обсуждать эту гипотезу: она скучная. Кроме того, в старой ли базе, в новой ли, а резкое уменьшение роли «рациональных» понятий в книжных текстах заметно невооруженным взглядом. Вторая гипотеза — влияние финансового кризиса, случившего в 2008 году, и, по мнению некоторых экономистов, так и не завершившегося. Можно предположить, что ухудшение экономического благосостояния людей привело к попыткам уйти в мир эмоций и фантазий, противопоставив его суровой реальности, данной им в ощущениях. Смущает только то, что другие экономические кризисы (даже известная и чреватая недобрым будущим Великая депрессия 1929–1939 годов) не приводили к таким заметным изменениям в частотах использования слов с эмоциональной или рациональной окраской. Наконец, есть еще третье объяснение. Именно в конце 2000-х годов в нашу жизнь начало всё активнее входить такое явление, как социальные сети: место, наихудшее для обсуждения принципиальных вопросов, но в то же время как никогда часто используемое для этой цели.
Нет сомнений в том, что соцсети сыграли важную роль в информировании общества о многих социальных проблемах и несправедливостях, творящихся в мире, но ранее скрытых от глаз широкой публики. Однако проблема в том, что социальные сети нередко благоприятствуют легкому переходу от фактов к преувеличениям, а от преувеличений — к откровенной дезинформации. В результате мир в глазах пользователя соцсетей представляет собой череду проблем, кризисов и несчастий, вызывающих у индивида преувеличенно негативное отношение к миру, себе и общественной системе. Такое неприятие общественного устройства может вызвать резкие и эмоциональные отклики на положение дел в социуме, усиливающиеся тем, что «система», которой человек начинает себя противопоставлять, обычно пытается апеллировать к рациональной части человеческой природы. Я хочу подчеркнуть, что сейчас максимально объективно изложил мнение авторов, которое почти не совпадает с моей интерпретацией полученных исследователями результатов.
Лично я считаю (и думаю, что читатели, следящие за новостными сводками в последнее время, со мной согласятся), что недовольство сложившимися общественными системами вполне рационально, а сами системы уже давно используют обращение к самым темным сторонам человеческой иррациональности для управления массовым сознанием. Соцсети же оказались лишь удобным инструментом для того, чтобы перенаправлять вполне рациональное недовольство в эмоциональную плоскость. Именно соцсети если и не создали культуру быстрых и эмоциональных оценок, простых решений и возможности быстро провоцировать эти простые оценки и решения, то, безусловно, создали благодатную почву для ее формирования (S. Vosoughi et al., 2018. The spread of true and false news online). Именно в них во многом сформировалось то общество постправды, в котором нам приходится жить сейчас. Конечно, очень трудно проследить четкую связь между языком соцсетей и книжным языком, но нельзя не признать, что авторы книг обычно являются продуктами того общества, в котором они воспитывались и живут.
Несколько слов о таком понятии, как постправда, которое авторы исследования часто используют, но которое наверняка знакомо не всем читателям. Оно определено как условия, при которых апелляция к фактам имеет меньшее значение при формировании общественного мнения, чем обращение к личным убеждениям и эмоциям людей. Часто термин используется в контексте «эпоха постправды», под которой подразумевают последние два десятилетия, когда возможности манипулировать общественным сознанием за счет «фейковых новостей», полуправды и своевременных «вбросов» той или иной информации стали почти безграничными (J. Harsin, 2018. Post-Truth and Critical Communication Studies). Понятие «постправда» появилось в академической среде в начале 1990-х, но активно проникать в обыденную речь начало только в середине 2010-х. Типичным примером постправды может служить не подкрепленный фактами ажиотаж вокруг связей с террористами правительства Саддама Хуссейна и разработки Ираком оружия массового поражения, приведший к спецоперации американских войск в междуречье Тигра и Евфрата. За более свежими примерами постправды далеко ходить не нужно…
Не все исследователи любят термин «постправда». Многие справедливо считают, что такое явление, как манипуляции общественным сознанием, куда древнее, чем новомодное понятие, и широко обсуждалось уже в социологической литературе XIX–XX веков (J. Harsin, 2018. Post-Truth and Critical Communication Studies). В каком-то смысле обсуждаемое нами исследование подтверждает последнюю точку зрения. Действительно, процесс отхода от рационального восприятия мира, отраженный в книжном языке, начался задолго до эпохи массового доступа к интернету и появления соцсетей. С другой стороны, начавшись в 70-е годы прошлого века, он значительно ускорился в последние полтора десятилетия, что намекает на причастность к этому современных медийных технологий.
Авторы обсуждаемой статьи довольно пессимистичны в отношении обнаруженного ими тренда. Они сомневаются в том, что общество вновь сможет сделать ставку на рациональное мышление в ближайшее время, и предлагают искать новый баланс между двумя способами мышления, эмоциональным и рациональным, в явном виде признавая важность последнего, но в то же время стараясь максимально эффективно использовать первый для решения фундаментальных задач. Эта фраза была и остается для меня загадкой. Она настолько обтекаема, что под ней легко подписался бы и нечистоплотный политикан, и твердолобый мракобес, и мистик, уловляющий кошельки и души. Мне кажется, именно в атмосфере такого баланса, смещенного в сторону иррациональности, человечество существовало в самые мрачные исторические эпохи — эпохи религиозного и политического тоталитаризма. Мне хочется верить, что нам не придется искать новый баланс подобного рода, что вместо этого тренд развернется и человечество начнет решать стоящие перед ним задачи, используя рациональный подход, оставив иррациональное для тех сфер и мест, где они уместны: дружбы, любви, филармонии и футбольного стадиона, хотя и там иногда не вредно сохранять холодную голову. Впрочем, надеясь на человечество, я, кажется, поддаюсь эмоциям.
В целом исследование выполнено на хорошем профессиональном уровне. Данные, полученные для языка художественных книг, хорошо соответствуют данным, полученным для научно-популярной литературы, документальных книг, языка газет и отчасти коррелируют с поисковыми запросами в Google, что намекает на связь книжного языка с более общими интересами публики. Тенденции, обнаруженные для английского и испанского языка, сходны с тенденциями для других больших языков, включая русский. К исследованию может быть предъявлено достаточно много методологических претензий, но, по зрелому размышлению, я решил, что ни одна из них не является критической. Более того, в основном методические недочеты обусловлены сложностью поставленной задачи и естественными проблемами, возникающими при изучении языка и социума. Думаю, что методические проблемы, как и сложности с интерпретацией полученных авторами результатов, будет уместнее обсудить в комментариях. В целом, исследование хорошо соотносится со здравым смыслом и кажется мне необычайно нужным и своевременным. Кто знает, может быть такие масштабные исследования нашего языка — то есть, в конечном итоге, того, как мы мыслим, — приведут со временем к новому синтезу в общественных науках и переменам в нашем мировосприятии?
Источник
Автор: bambukovi