» » » » Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры


Авторские права

Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Здесь можно купить и скачать "Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры" в формате fb2, epub, txt, doc, pdf. Жанр: Научная Фантастика, издательство АСТ, год 2016. Так же Вы можете читать ознакомительный отрывок из книги на сайте LibFox.Ru (ЛибФокс) или прочесть описание и ознакомиться с отзывами.
Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
Рейтинг:
Название:
Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
Издательство:
неизвестно
Год:
2016
ISBN:
978-5-17-088935-8
Вы автор?
Книга распространяется на условиях партнёрской программы.
Все авторские права соблюдены. Напишите нам, если Вы не согласны.

Как получить книгу?
Оплатили, но не знаете что делать дальше? Инструкция.

Описание книги "Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры"

Описание и краткое содержание "Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры" читать бесплатно онлайн.



Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.






Мир глазами Ципфа

До Ципфа ученые полагали, что большинство вещей, поддающихся измерению, ведут себя подобно человеческому росту.



Рост человека не очень сильно варьируется. Рост 90% жителей США составляет от 155 см до 185 см. Разумеется, рост некоторых особенно высоких баскетболистов достигает 220 см и выше, а рост самого низкого взрослого человека в мире составляет менее 62 см. Однако подобные случаи встречаются крайне редко. Но даже с учетом этих крайностей самые высокие люди всего в 4–5 раз выше самых низкорослых[53]. У математиков имеется особый термин для описания распределения такого рода, при котором значения настолько тесно группируются вокруг среднего значения. Подобное часто встречающееся распределение называется «нормальным». До Ципфа люди считали, что мы живем в нормальном мире, где нормальным оказывалось бы все окружающее.

Однако, как мы уже видели, мир слов далек от нормального – распределение в нем соответствует вполне определенному, но кажущемуся на первый взгляд странным математическому принципу. В наши дни ученые называют такое поведение степенными законами[54]. Удивительно, но как только Ципф обнаружил свой первый степенной закон в языке, то начал тут же находить и другие его проявления.

Например, Ципф обнаружил, что степенным законам следуют показатели богатства и доходов. Если бы ваш рост был пропорционален величине вашего банковского счета, а среднее американское домохозяйство имело рост около 170 см, то рост Билла Гейтса оказался бы больше, чем расстояние от Земли до Луны[55]. Величина статей в Encyclopedia Britannica также следует степенному закону, как и тираж газет. Ученые, следовавшие по стопам Ципфа, обнаружили тысячи других примеров: размер городов, частотность определенных фамилий, количество жертв в ходе военных действий, продолжительность аплодисментов после спектакля, популярность людей в Facebook и Twitter, объем пищи, потребляемой животными, трафик на веб-сайтах, доля белков в наших клетках, количество клеток различных типов в наших телах, распространенность тех или иных биологических видов в наших экосистемах и даже размер дырок в швейцарском сыре. Степенному закону следует даже продолжительность отключений электричества (хотя в данном случае, возможно, нам стоит назвать это «законом отсутствия энергии»).

Хотя работа Ципфа была настоящим прорывом, причины выявленного им закона остаются тайной. Сам Ципф верил, что такая закономерность объясняется практической эффективностью подобного распределения. Другие исследователи указывали на то, что большому объекту несложно стать еще больше. Этот процесс можно описать формулой «богатым проще богатеть». С математической точки зрения было показано, что процесс, описываемый словами «богатым проще богатеть», может проявляться в огромной массе степенных законов. Например, знакомство с одними людьми помогает знакомиться с новыми, поэтому изначально популярные люди, следуя выявленной Ципфом закономерности, становятся еще более популярными. Города, уже ставшие крупными, могут показаться привлекательными для тех, кто подумывает о переезде, что демонстрирует степенной закон размера города. Вот вам еще один пример – доказано, что обезьяны, печатающие на компьютере случайным образом, могут создавать «слова» (символы, разделенные пробелами) и количество этих слов также следует степенному закону[56].

Существует немало конкурирующих между собой объяснений любого конкретного распределения, следующего степенному закону. К сожалению, не исключено, что это изобилие объяснений отражает тот факт, что ученые не знают, что происходит на самом деле.

Тем не менее вне зависимости от причины возникновения степенные законы четко описывают огромный диапазон природных и социальных явлений. Ципф, преподаватель немецкого языка, воспользовавшись невероятной любовью Хенли к «Улиссу», начал революцию, последствия которой в значительной мере трансформировали измерения в социальных науках и щупальца которой дотянулись до биологии, физики и даже математики. Теперь нормально то, что выявил Ципф.

Не слишком ли много Ципфа

Закон Ципфа был всего лишь пробным камнем, необходимым нам для начала поиска языковых окаменелостей. Почти все в языке следует закону Ципфа – существительные, глаголы, прилагательные, наречия, начинающиеся на букву m, слова для описания профессий, слова, рифмующиеся со словом «рифма», и так далее. Так что если вы натыкаетесь на что-то, не соответствующее универсальному принципу Ципфа, можно смело считать, что что-то тут не то. Подобно куску белого камня, который находят в ходе экспедиции на особенно многообещающем месте, языковое явление, не следующее степенному закону, может оказаться настоящей окаменелостью в эволюции нашего языка.

Именно здесь нужно снова задать тот «детский» вопрос, который в свое время привлек наше внимание: «Почему мы говорим drove, а не drived

Drove – одно из английских слов, называемых неправильными глаголами[57]. Эти неправильные глаголы – очень странная вещь. Если бы они следовали закону Ципфа, как и все остальные классы слов, то можно было бы ожидать, что они редки. На практике же почти все неправильные глаголы встречаются довольно часто. Хотя к неправильным относится лишь около 3% глаголов, на практике именно они используются чаще других. Проще говоря, неправильные глаголы представляют собой явное и серьезное отклонение от закона Ципфа. Именно их мы и искали, как будто рядом со скелетом тираннозавра кто-то поставил статистические указатели.

Что же представляют собой эти так называемые неправильные глаголы, что они сделали с законом Ципфа и что это значит с точки зрения эволюции языка?

Избранные, гордые и сильные

На первый взгляд, в спряжении английских глаголов нет ничего сложного. Все, что требуется вам для образования прошедшего времени английского глагола, – это добавить к нему – ed: глагол jump («прыгать») превращается в jumped («прыгал»). Этому простому правилу следуют сотни тысяч глаголов. И даже если в языке появляется новый глагол, он будет спрягаться так же. Может быть, я никогда не слышал о действии, называемом flamboozing («алкоголеподжигание»), но я знаю, что если вы решили flambooze («алкоголеподжигать») вчера, то вчера вы flamboozed («алкоголеподжигали»).

Исключением – к немалому огорчению людей, изучающих английский, – выступают неправильные глаголы типа know («знать»). Даже не прочитав это предложение, вы уже знали (knew), что мы не скажем knowed. К этим тремстам неправильным глаголам – которые лингвисты иногда называют «сильными», – относятся десять наиболее часто встречающихся глаголов в английском языке: be/was («быть, был»), have/had («иметь/имел»), do/did («делать/делал»), say/said («говорить/сказал»), go/went («идти/пошел»), get/got («получить/получил»), make/ made («делать/сделал»), know/knew («знать/знал»), see/saw («видеть/видел»), think/thought («думать/думал»). Они встречаются настолько часто, что глагол, который вы собираетесь употребить, с вероятностью 50% будет неправильным.

Откуда возникли неправильные глаголы? Это длинная история. Примерно от 6 до 15 тысяч лет назад активно использовался язык, известный современным ученым как праиндоевропейский. Из этого языка произошли многие современные языки, в том числе английский, французский, испанский, итальянский, немецкий, греческий, чешский, персидский, санскрит, урду, хинди и сотни других. В праиндоевропейском языке было явление, известное ученым как аблаут, при котором одно слово превращалось в другое, близкое, с помощью замены гласных по определенным правилам[58]. В современном английском языке аблаут можно заметить как раз среди неправильных глаголов.

Вот вам пример: сегодня я пою (sing), вчера я пел (sang), песня была спета (sung). Аналогичным образом: сегодня я звоню (ring), вчера я звонил (rang), телефон прозвонил (rung). И еще один: сегодня я застреваю (stick), вчера я застревал (stuck). Сегодня я копаю (dig), вчера я копал (dug). Отмирая, правила спряжения оставляют после себя окаменелости, которые мы называем неправильными глаголами.

Но если это так, то какой же грамматический астероид уничтожил эти древние правила, оставив нам лишь высохшие кости неправильных глаголов?

Этим астероидом был так называемый дентальный суффикс, имеющий в современном английском языке форму – ed[59]. Применение – ed для обозначения прошедшего времени началось еще в прагерманском языке, на котором говорили в Скандинавии в 500–250 гг. до н. э. Прагерманский был предком всех современных германских языков, включая английский, немецкий, голландский и множество других. Будучи наследником праиндоевропейского языка[60], прагерманский унаследовал у него старую схему для спряжения глаголов на основе аблаута. И чаще всего с ее применением не возникало никаких проблем. Однако время от времени в языке появлялись новые глаголы, и некоторые из них просто не укладывались в старую схему аблаута. Поэтому люди, говорившие на прагерманском, изобрели кое-что новое – теперь образовывать прошедшее время этих молодых, не склонных к конформизму глаголов можно было, добавляя к ним в конце – ed. В прагерманском языке правильные глаголы были скорее исключениями.


На Facebook В Твиттере В Instagram В Одноклассниках Мы Вконтакте
Подписывайтесь на наши страницы в социальных сетях.
Будьте в курсе последних книжных новинок, комментируйте, обсуждайте. Мы ждём Вас!

Похожие книги на "Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры"

Книги похожие на "Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры" читать онлайн или скачать бесплатно полные версии.


Понравилась книга? Оставьте Ваш комментарий, поделитесь впечатлениями или расскажите друзьям

Все книги автора Жан-Батист Мишель

Жан-Батист Мишель - все книги автора в одном месте на сайте онлайн библиотеки LibFox.

Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.

Отзывы о "Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры"

Отзывы читателей о книге "Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры", комментарии и мнения людей о произведении.

А что Вы думаете о книге? Оставьте Ваш отзыв.