Специалисты из Google, занимающиеся оцифровкой и распространением книг в сети, и ученые из Гарвардского университета запустили проект "поиска по культурным тенденциям", сообщает РИА "Новости" со ссылкой на журнал Science.

Создатели проекта относят его к новой области знаний, названной культуромикой и основанной на данных статистического анализа оцифрованных книг, которая связана с "количественным" изучением истории языка и словесности, а также проявлений того или иного культурного феномена в истории.

С помощью Books Ngram Viewer можно, например, выяснить, какие люди, объекты и явления пользовались популярностью в течение последних двухсот лет и на какой период пришелся пик их известности.

Поиск ведется по базе данных, куда вошли 5,2 млн оцифрованных книг на шести языках — английском, немецком, французском, испанском, китайском и русском. Книги были изданы в период с 1800 по 2000 гг.

Среди них присутствует как художественная литература, так и справочники, техническая и учебная литература. Этот массив содержит 500 миллиардов слов, прочесть которые не под силу ни одному человеку.

Первые результаты

Согласно выводам команды исследователей, возглавляемой Жаном-Баптистом Мишелем из Гарвардского университета, сегодня английский язык содержит порядка миллиона слов. За последние 50 лет его словарный запас вырос почти на 70%, а скорость роста составила примерно 8,5 тысяч слов в год, хотя в настоящее время в разговоре или письме используется лишь половина этого лексикона.

Как показали ученые, свой отпечаток на язык накладывают и внешние факторы, в частности, политические режимы.

Например, упоминания художника Марка Шагала, еврея по национальности, в печатной продукции нацистской Германии 1936-1944 годов не встречаются практически ни разу, тогда как в англоязычных источниках попадаются достаточно часто. Аналогичная ситуация наблюдается в отношении Льва Троцкого в определенный период истории Советского Союза или площади Тяньаньмэнь, где в 1989 году прошли массовые волнения, в китайских источниках.

С помощью этого статистического подхода, как показали ученые, можно проследить влияние внешних факторов на проявление в культуре таких понятий, как феминизм, бог, эволюция, здоровый образ жизни и других, в той или иной степени интересующих каждого члена общества.

"Культуромика расширяет границы возможного до настоящего времени количественного анализа большого количества явлений в социальной сфере и гуманитарных науках.

Изучение культурного отпечатка конкретного понятия в истории интересно многим людям, однако мы надеемся, что наш подход будет особенно активно использоваться учеными, изучающими гуманитарные науки и социальные дисциплины", - сказал Эрез Либерман Эйден, соавтор публикации, слова которого приводит пресс-служба Гарвардского университета.