» » » » Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры


Авторские права

Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры

Здесь можно купить и скачать "Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры" в формате fb2, epub, txt, doc, pdf. Жанр: Научная Фантастика, издательство АСТ, год 2016. Так же Вы можете читать ознакомительный отрывок из книги на сайте LibFox.Ru (ЛибФокс) или прочесть описание и ознакомиться с отзывами.
Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
Рейтинг:
Название:
Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
Издательство:
неизвестно
Год:
2016
ISBN:
978-5-17-088935-8
Вы автор?
Книга распространяется на условиях партнёрской программы.
Все авторские права соблюдены. Напишите нам, если Вы не согласны.

Как получить книгу?
Оплатили, но не знаете что делать дальше? Инструкция.

Описание книги "Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры"

Описание и краткое содержание "Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры" читать бесплатно онлайн.



Насколько велики на самом деле «большие данные» – огромные массивы информации, о которых так много говорят в последнее время? Вот наглядный пример: если выписать в линейку все цифры 0 и 1, из которых состоит один терабайт информации (вполне обычная емкость для современного жесткого диска), то цепочка цифр окажется в 50 раз длиннее, чем расстояние от Земли до Сатурна! И тем не менее, на «большие данные» вполне можно взглянуть в человеческом измерении. Эрец Эйден и Жан-Батист Мишель – лингвисты и компьютерные гении, создатели сервиса Google Ngram Viewer и термина «культуромика», показывают, каким образом анализ «больших данных» помогает исследовать трудные проблемы языка, культуры и истории.






Однако случай неправильных глаголов не очень характерен для биологической эволюции. В биологии для определения степени приспосабливаемости отдельного организма принимаются во внимание тысячи или даже миллионы признаков. Что же касается неправильных глаголов, было ясно, что их выживаемость в значительной степени определяется единственным признаком – частотой употребления. И это значительно упростило работу. Это значило, что мы сможем с довольно большой долей точности рассчитать, насколько быстро исчезнут неправильные формы глаголов.

Однако перед тем как заняться этим вопросом более основательно, позвольте напомнить о самом известном в науке примере исчезновения. Мы имеем в виду теорию радиоактивного излучения.

Радиоактивные материалы используются в массе устройств – от энергетических реакторов до медицинских сканирующих систем и бомб. Эти материалы постоянно находятся в процессе исчезновения, поскольку с течением времени атомы радиоактивного вещества превращаются в стабильные нерадиоактивные атомы. Этот распад высвобождает энергию, часто в форме радиоволн.

Именно поэтому радиоактивные вещества и получили свое название.

Самое важное свойство радиоактивного элемента – это его период полураспада, то есть период времени, в среднем требующийся для распада половины атомов в образце элемента[67]. Предположим, что у вас имеется вещество, период полураспада которого составляет один год. Если сначала у вас есть миллиард атомов этого вещества, то через год останется лишь половина миллиарда – другая половина миллиарда распадется на что-то другое. После двух лет у вас останется лишь четверть миллиарда атомов (половина от половины). Через три года останется одна восьмая и так далее.

В процессе изучения трансформации неправильных глаголов в правильные мы обнаружили, что если мы примем во внимание частоту употребления, то процесс выравнивания будет неотличим с математической точки зрения от процесса распада радиоактивного атома. Более того, зная частоту употребления неправильного глагола, мы могли создать формулу для расчета периода его полураспада. Это было замечательно, поскольку в случае радиоактивных атомов период полураспада определяется экспериментальным путем; его обычно невозможно рассчитать. В этом смысле математика радиоактивности лучше подходит неправильным глаголам, а не радиоактивным атомам.

Формула была простой и прекрасной – период полураспада глагола представляет собой квадратный корень от частоты его употребления. Неправильный глагол, использующийся в сто раз реже, приобретет правильную форму в десять раз быстрее.

Например, у глаголов, частота употребления которых находится в пределах между одним из ста и одним из тысячи, – глаголов типа drink («пить») или speak («говорить») – период полураспада составляет примерно 5400 лет. Это сопоставимо с периодом полураспада углерода-14 (5715 лет), изотопа, который чаще других используется для датирования древних артефактов.

Будущее прошедшее

Как только вы рассчитаете период полураспада неправильных глаголов, у вас появляется возможность сделать прогнозы об их будущем. Основываясь на вышеупомянутом анализе, мы предсказали, что к определенному времени один из глаголов из набора begin («начать»), break («ломать»), bring («приносить»), buy («покупать»), choose («выбирать»), draw («рисовать»), drink («пить»), drive («ехать»), eat («есть»), fall («падать») превратится в правильный. Из набора bid («предлагать цену»), dive («нырять»), heave («вздыматься»), shear («стричь»), shed («ронять»), slay («убивать»), slit («перерезать»), sow («сеять»), sting («жалить»), stink («вонять») правильными станут пять глаголов. А если процесс пойдет так и дальше, то к 2500 году неправильными останутся лишь 83 из наших 177 неправильных глаголов.

Мы были настолько рады своим открытиям, что даже создали короткую историю на основе своих прогнозов:

Он был хорошо воспитанным представителем XXVI столетия, поэтому его задели (stinged) слова о том, что используемая им грамматика «воняет» (stunk). «Stinked», – поправил своих собеседников путешественник во времени.

Так что, если вы планируете в ближайшее время заняться путешествиями во времени, вам стоит запомнить эту поучительную историю.

Мы также предсказали судьбу некоторых глаголов. Какие из сегодняшних неправильных глаголов после тысячи лет, проведенных вместе, откажутся от нынешнего партнера по спряжению в пользу «молодой модели»? Как ни парадоксально, это глагол wed – wed («женить»), один из самых редко употребляемых современных неправильных глаголов. К примеру, уже сейчас в обиход входит форма wed – wedded. Так что скоро уже вы как новобрачные не сможете назвать себя newly wed.

И, наконец, мы смогли ответить на «детский» вопрос, с которого начали свое путешествие: «Почему мы говорим drove, а не drived

Причина, по которой мы все еще говорим drove – отказавшись при этом от других неправильных форм типа throve, – состоит в том, что drove используется в сотни раз чаще, чем throve. Это значит – основываясь на нашем небольшом уравнении, – что для drove вероятность стать правильным в десять раз меньше, чем для throve. Разумеется, со временем drove исчезнет, если английский язык проживет достаточно долго[68]. Наши расчеты показывают, что у нас есть примерно 7800 лет, перед тем как глагол drove скроется в лучах заката. Так что дети еще какое-то – довольно долгое – время будут задавать свой детский вопрос.

Блестящая туфля Джона Гарварда

В центре Гарвард-Ярда находится большая статуя, поставленная в честь Джона Гарварда. Эта бронзовая фигура имеет довольно скучный цвет, если не считать сияющей левой туфли. По какой-то странной причине фотография с рукой, касающейся туфли, считается чуть ли не обязательной для любого туриста, посещающего Гарвард.

Почему туфля у статуи Джона Гарварда так сверкает? Большинство считает, что, когда скульптура создавалась, вся она – включая обувь – имела скучный бронзовый цвет и что постепенная полировка тысячами рук туристов позволила проявиться блестящей поверхности.

Однако бронза – это изначально сверкающий металл. Когда скульптура была отлита более 100 лет назад, то она – как и любая другая бронзовая скульптура – сверкала довольно ярко. Верхний матовый слой скульптуры, известный под названием «патина», представляет собой результат коррозии, связанной с природными условиями, усилиями реставраторов и даже желанием самого автора. Подлинный цвет металла выжил лишь в туфле, благодаря частой полировке руками проходящих мимо[69].

И это очень похоже на неправильные глаголы. При первой встрече с ними вы не можете не удивиться: почему эти странные исключения дожили до наших дней? Однако, по сути, неправильные глаголы следуют в наши дни тем же закономерностям, что и много столетий назад. Хотя язык вокруг них менялся, частый контакт защищал неправильные глаголы от коррозии. Они представляют собой окаменелости эволюционного процесса, который мы только начинаем понимать. В наши дни мы называем все остальные глаголы правильными или регулярными. Однако регулярность – это не свойство языка по умолчанию. Правило – это могильный камень для тысячи исключений.

Словарь и конкорданс

Книга Word Index to James Joyce’s Ulysses была подлинным триумфом, отражавшим годы настойчивости и внимания к деталям. Во время публикации в 1937 году подобные индексы были доступны лишь для самых важных книг, несмотря на тот факт, что само по себе написание конкордансов имеет долгую и славную историю. Старейшие конкордансы еврейской Библии, известные под названием Масора, возникли более тысячи лет назад.

Все изменилось в 1946 году. В тот год иезуитскому монаху по имени отец Роберто Буса пришла в голову отличная идея. Буса, изучавший творчество плодотворного теолога Фомы Аквинского, захотел создать конкорданс работ Аквината, который бы помогал ему в исследованиях. Компьютерная технология только начинала свое резкое восхождение, и Буса посчитал, что сможет создать конкорданс новым способом, «скормив» текст книги в одну из новых машин. Он отправился с этой идеей прямиком в IBM. Представители компании выслушали его и решили поддержать. Потребовались 30 лет и серьезная помощь со стороны IBM, однако со временем план Бусы сработал – в 1980 году был завершен монументальный Index Thomisticus[70]. Мир исследователей был впечатлен. Как и Index Хенли, Index Бусы позволил развиться новой области деятельности. Работа в этой области (известной в наши дни под названием цифровых гуманитарных наук) направлена на выявление того, каким образом компьютеры могут пригодиться для таких традиционных гуманитарных занятий, как история и литература[71].


На Facebook В Твиттере В Instagram В Одноклассниках Мы Вконтакте
Подписывайтесь на наши страницы в социальных сетях.
Будьте в курсе последних книжных новинок, комментируйте, обсуждайте. Мы ждём Вас!

Похожие книги на "Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры"

Книги похожие на "Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры" читать онлайн или скачать бесплатно полные версии.


Понравилась книга? Оставьте Ваш комментарий, поделитесь впечатлениями или расскажите друзьям

Все книги автора Жан-Батист Мишель

Жан-Батист Мишель - все книги автора в одном месте на сайте онлайн библиотеки LibFox.

Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.

Отзывы о "Жан-Батист Мишель - Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры"

Отзывы читателей о книге "Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры", комментарии и мнения людей о произведении.

А что Вы думаете о книге? Оставьте Ваш отзыв.