Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.

Еще из серии Наука XXI век

Читать онлайн Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры


Моему папе, который всегда верил, что я умею считать

– ЭРЕЦ ЭЙДЕН —

Моей семье

– ЖАН-БАТИСТ МИШЕЛЬ —
* * *

Erez Aiden and Jean-Baptiste Michel

Uncharted: Big Data as a Lens on Human Culture


Дизайн обложки: студия OpenDesign

Печатается с разрешения авторов и литературного агентства Brockman, Inc.


Исключительные права на публикацию книги на русском языке принадлежат издательству AST Publishers. Любое использование материала данной книги, полностью или частично, без разрешения правообладателя запрещается.


Фото Эреца Эйдена © Eliza Grinnel

Фото Жана-Батиста Мишеля © Bret Hartman

© Erez Lieberman Aiden and Jean-Baptiste Michel, 2013

© Павел Миронов, перевод, 2014

© Издание на русском языке AST Publishers, 2016

Глава 1

Зазеркалье

Давайте представим, что у нас есть робот, способный прочитать каждую книгу на каждой полке всех крупных библиотек мира. Он может их прочесть невероятно быстро и запомнить каждое прочитанное слово в своей бесперебойно работающей памяти. Чему мы могли бы научиться у такого робота-историка?

Вот вам простой пример, знакомый каждому американцу. В наши дни принято говорить, что южные штаты полны (are full, множественное число) южан. Мы также говорим, что северные штаты полны (are full) северян или что штаты Новой Англии полны (are full) жителями. Однако мы говорим: the United States is full of citizens (то есть «США полон жителей», единственное число). Почему мы используем единственное число? Вопрос лежит не только в области грамматики – это, скорее, вопрос нашей национальной идентичности.

После основания Соединенных Штатов Америки основополагающий документ – Статьи Конфедерации – наделил центральное правительство слабыми полномочиями и описывал новое государство не как национальное объединение, а, скорее, как «дружеский союз» между отдельными государствами, чем-то напоминающий современный Европейский союз. Люди воспринимали себя не гражданами США, а гражданами определенного штата (государства).

И в этом смысле граждане говорили о Соединенных Штатах во множественном числе, что было вполне закономерно для союза различных и в целом независимых государств. Например, в обращении президента Джона Адамса 1799 года говорится о «Соединенных Штатах и их договорах с ее Британским Величеством» (курсив наш. – Э. Э. и Ж.-Б. М.). В наше время для президента США это совершенно немыслимо.

Когда же слова «Мы, народ…» (Конституция США, принятая в 1787 году) стали обозначать «одну нацию» (Клятва верности флагу, включенная в «Кодекс о флаге США» в 1942 году)? [1]

Если бы мы спросили об этом людей-историков, то, возможно, они бы указали нам на самый знаменитый ответ из финала знаменитой книги Джеймса Макферсона по истории гражданской войны – «Боевой клич свободы» [2]:

…Некоторые масштабные последствия войны кажутся очевидными. Были побеждены раскол и рабство, чтобы никогда не возникнуть вновь, даже через полтора столетия после Аппоматокса. Этот итог означал серьезную трансформацию американского общества и изменение государственного устройства, уточнившегося, если не сформировавшегося, в результате войны.

До 1861 года слова «Соединенные Штаты» чаще всего использовались как существительное во множественном числе: the United States are republic («Соединенные Штаты представляют собой республику»). Война привела к тому, что «Соединенные Штаты» стали в английском языке существительным в единственном числе.

Макферсон был не первым, кто выдвинул такое предположение; эта тема обсуждается уже не менее сотни лет. Стоит хотя бы вспомнить выдержку из статьи в газете Washington Post, опубликованной в 1887 году[3]:

Какое-то время, буквально несколько лет назад, о Соединенных Штатах говорилось во множественном числе. Было принято говорить: «Соединенные Штаты имеют» или «Соединенные Штаты являлись». Однако война все изменила. Вопрос грамматики был навсегда решен на линии огня от Чесапика до Сэбин-Пасс. Решение приняли не Уэллс, не Грин, не Линдли Мюррей, а сабли Шеридана, мушкеты Шермана и артиллерия Гранта… Поражение мистера Дэвиса и генерала Ли означало переход от множественного числа к единственному.


Вам будет интересно
Казалось бы, термин «большие данные» понятен и доступен только специалистам. Но автор этой книги доказывает, что анализ данных можно организовать и в простом, понятном, очень эффективном и знакомом многим Excel. Причем не важно, сколько велик ваш массив данных. Техники, предложенные в этой книге, будут полезны и владельцу небольшого интернет-магазина, и аналитику крупной торговой компании. Вы перестанете бояться больших данных, научитесь видеть в них нужную вам информацию и сможете проанализиров...
Читать онлайн
Рассмотрены основные области компьютерных технологий и их роль в современном обществе, научно-исследовательской, инновационной, научно-педагогической, производственно-технологической и проектно-технологической профессиональной деятельности, структура операционных систем, алгоритмы планирования задач....
Читать онлайн
Книга написана для начинающих программистов. Ко всем задачам есть решения. Присутствуют задачи повышенной сложности....
Читать онлайн
В учебно-методическом пособии рассматриваются основы языка программирования PL/SQL, реализованного в системе управления базами данных Oracle Database Server. Приводятся сведения о поддерживаемых типах данных, структуре программ PL/SQL и выполнении SQL-предложений в них. Отдельно рассмотрено создание хранимых в базах данных Oracle программ PL/SQL – процедур, функций, пакетов и триггеров....
Читать онлайн
Как жить в мире, где информацию о тебе может получить кто угодно и когда угодно? Ведущий мировой эксперт по будущему Big Data Андреас Вайгенд знает ответ. Он разрабатывал стратегию данных таких крупных рыб, как Alibaba, Goldman Sachs, Lufthansa, Thomson Reuters. Работал руководителем по Big Data в компании Amazon, является Директором компании Social Data Lab, преподаёт в IT-школе Калифорнийского университета Беркли.Андреас уверен, что этот «дом со стеклянными стенами» несет в себе не только боль...
Читать онлайн
Наш телефон знает о нас больше, чем мы думаем. Он умеет собирать и анализировать информацию о том, как мы передвигаемся по городу, какие посты лайкаем и какими приложениями пользуемся. Он сообщит о пробках и поторопит на работу, чтобы мы не опоздали; подберет музыку под наше настроение и составит список персональных рекомендаций, чем можно занять себя в течение дня. Телефон – больше не устройство, по которому звонят, это уже средство управления окружающим нас миром. Незаметно мы окружили себя та...
Читать онлайн
Что общего у аналитика данных и Шерлока Холмса? Как у Netflix получилось создать 100 %-ный хит – сериал «Карточный домик»? Ответ кроется в правильном использовании данных. Эта книга – практическое руководство и увлекательное путешествие в науку о данных, независимо от того, хотите ли вы использовать анализ данных в своей профессии, собираетесь ли стать аналитиком данных, или уже работаете в этой области. Ее автор, основатель образовательного онлайн-портала и консультант, Кирилл Еременко просто и...
Читать онлайн
Сегодня наука о данных используется практически во всех сферах: вы видите подобранные специально для вас рекламные объявления, рекомендованные на основе ваших предпочтений фильмы и книги, ссылки на предполагаемых друзей в соцсетях, отфильтрованные письма в папке со спамом.Книга знакомит с основами науки о данных. В ней охватываются все ключевые аспекты, начиная с истории развития сбора и анализа данных и заканчивая этическими проблемами, связанными с конфиденциальностью информации. Авторы объясн...
Читать онлайн
Девушка из 90-х с детства рисует. Раздумывая, стать ли ей художником в дальнейшем, попадает в течение эпохи криминала. Связавшись с контрабандистом, становится на путь, уводящий ее от прежней жизни. Чеченская банда, наркотики и преступление приводят ее в тупик. Повесть рассказывает о жизни в заключении с необычной стороны. В повести встречаются романтические чеченские бандиты, заключенные, монах, дающий надежду на лучшее будущее, которое уходит за пределы внешнего мира....
Читать онлайн
Хиха – добрая девочка.Хрюкс – ее странный кот.Она хихикает, он хрюкает.Вместе они танцуют, путешествуют по миру и ищут путь к себе.В пушистом городе живут и другие персонажи:Тетушка Эмма, которая варит сок манго, любимый напиток Хихи.Ее муж, водитель грузовичка Марк, ответственный и трудолюбивый.Мальчик Евгений, сварливый, но милый.Его желтая канарейка, поющая чудесные песни.Актер из Буэнос-Айреса муравьед Серхио, смелый фантазер.Медведица Анфиса, пекущая лучшие кексики в городе....
Читать онлайн
Страстная любовь порой может превратиться в безумие жестокости. Он не из тех, кто умеет прощать предательство, он не из тех, кто может испытывать жалость. Он вообще не человек. В нем не стоит будить зверя. Но есть те, кто знают, как подвести его к грани, за которой он станет палачом для той единственной, которую когда-либо любил. Но любовь не проходит бесследно, ее отголоски живут под коркой льда в израненном сердце вампира, и, может быть, есть шанс усмирить безумие зверя....
Читать онлайн
Диана – профессиональная балерина. В этот злополучный вечер их труппу пригласили в загородный дом одного из влиятельных политиков, только Диана не знала, что для нее это выступление должно стать последним. Она просто одна из жертв на кровавом пиршестве вампиров. В эту ночь она поняла, что в мир разделен на две части, и там, за гранью, самые страшные кошмары становятся явью. Ее спас ОН – воин тьмы, спас случайно, выполняя очередной заказ своего Повелителя. Что принесет ей эта роковая встреча: сме...
Читать онлайн