Насколько велики на самом деле "большие данные" - огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на "большие данные" вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель - лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина "культуромика", показывают, каким образом анализ "больших данных" помогает исследовать трудные проблемы языка, культуры и истории.