» » » Робин Ли - Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google


Авторские права

Робин Ли - Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google

Здесь можно купить и скачать "Робин Ли - Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google" в формате fb2, epub, txt, doc, pdf. Жанр: Зарубежная публицистика, издательство Литагент 5 редакция «БОМБОРА», год 2021. Так же Вы можете читать ознакомительный отрывок из книги на сайте LibFox.Ru (ЛибФокс) или прочесть описание и ознакомиться с отзывами.
Робин Ли - Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google
Рейтинг:
Название:
Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google
Автор:
Издательство:
неизвестно
Год:
2021
ISBN:
978-5-04-107288-9
Вы автор?
Книга распространяется на условиях партнёрской программы.
Все авторские права соблюдены. Напишите нам, если Вы не согласны.

Как получить книгу?
Оплатили, но не знаете что делать дальше? Инструкция.

Описание книги "Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google"

Описание и краткое содержание "Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google" читать бесплатно онлайн.



Baidu – китайская компания, предоставляющая веб-сервисы, основным из которых является одноименная поисковая система. Технологии Baidu способны переводить речь в режиме реального времени с одного языка на другой, распознавать степень правдивости найденной информации и даже найти похищенного человека. Из этой книги вы узнаете, какие технологии помогли Baidu обыграть Google и какие возможности в будущем откроет перед нами искусственный интеллект. В формате PDF A4 сохранен издательский макет.





В 1990-х гг. немногие ученые, такие как Джеффри Хинтон и Майкл Джордан, настаивали на изучении машинного обучения. Ву Энда, бывший главный ученый Baidu, учился у Джордана в 90-е, а после преподавал теорию машинного обучения и даже организовал собственные онлайн-курсы. В настоящее время деканом научно-исследовательского института Baidu является Линь Юаньцин. Сю Вэй, один из выдающихся ученых корпорации, стал первым, кто предложил использовать нейронные сети для языковых моделей. Специалист по искусственному интеллекту, член американской инженерной академии, Владимир Вапник изобрел систему SVM (Support Vector Machine). Ян Лекун – лидер в области глубоких исследований, руководитель лаборатории искусственного интеллекта Facebook, изобрел специальную архитектуру сверточных нейронных сетей. А бывший директор лаборатории глубинного обучения Леон Батту является разработчиком ядра алгоритма глубинного градиента.

Исследования искусственного интеллекта прошли через несколько фаз. Первоначальные исследования ИИ основывались на правилах. Люди суммировали правила, введенные в компьютер, а сам компьютер этого сделать не мог. Следующий, более продвинутый подход основан на технологии машинного обучения. Он позволяет найти наиболее подходящие модели из больших объемов данных.

За два года развития искусственный интеллект смог поразить мир технологий. Он стал сублимированной версией технологии машинного обучения, основанной на многослойном нейросетевом компьютерном чипе. Благодаря многослойным микросхемам, которые имитируют соединение нейронов в человеческом мозге, в сочетании с усовершенствованным алгоритмом поощрения и наказания и возможностью переработки большого объема данных компьютер научился находить закономерности и вычленять модели из огромного количества информации. Это открыло новую эру в развитии интеллекта машин.

Немногие продолжали настаивать на разработке теории искусственного интеллекта, чтобы спасти уже проделанную работу. В Китае Baidu была одной из первых компаний по разработке ИИ. И, кажется, мы сделали то, о чем другие не могли даже мечтать. Шесть или семь лет назад я и Лу Цзи обсуждали прогресс, достигнутый в глубоком обучении. Мы сошлись во мнении, что готовы войти в эту сферу. В конце концов, в 2013 году я официально объявил о создании IDL (институт глубокого обучения). Он должен был стать первым институтом глубокого обучения в бизнес-сообществе. Я стал деканом не потому, что знаю больше, чем кто-либо другой. Для меня это своеобразный способ подчеркнуть степень своего внимания к предмету. А еще возможность отблагодарить тех ученых, которые не отступили в тяжелые годы.

Baidu никогда раньше не создавал научно-исследовательские институты. Наши инженеры были исследователями, а их работа всегда была тесно переплетена с практическим применением. Но я считаю, что глубокое обучение в будущем окажет огромное влияние на многие отрасли науки и жизни и шагнет далеко за пределы компетенции нашей компании. Поэтому необходимо создать специальное пространство для привлечения талантов, где бы они смогли свободно экспериментировать с инновациями, проводить исследования в неизвестных раньше областях и прокладывать путь искусственному интеллекту в жизнь человека.

На смену интеллекту

Если назвать этап просветления искусственного интеллекта версией 1.0, то машинный перевод будет следующим – 2.0. Раньше методы машинного перевода основывались на наборе слов и правил. Люди постоянно суммировали грамматические правила, но это не помогло усовершенствовать перевод. С человеческим языком машины не справляются. Особенно, когда речь идет о переводе в контексте. Например, фраза «how old are you».

Позднее появился SMT (статистический машинный перевод). Его основная идея заключается в том, чтобы посредством статистического анализа выявить общие правила использования слова или словосочетания и попытаться избежать появления нелогичных фраз. SMT имеет основные функции машинного обучения – обучение и декодирование. Этап обучения позволяет компьютеру построить модель перевода с помощью статистических данных, а затем использовать ее для перевода. Этап декодирования использует расчетные параметры, чтобы получить наиболее подходящий результат от перевода.

Исследование SMT продолжается уже более 20 лет. Для фраз и коротких предложений уже достигнут значительный прогресс. Но перевод длинных предложений, особенно со сложных языков, вроде китайского или английского, все еще оставляет желать лучшего. До недавнего времени никто не задумывался о подходе NMT (переводе, основанном на нейронных сетях). В его основе – нейронная сеть с бесчисленным количеством узлов. Исходное предложение векторизуется и передается через средний слой сети компьютеру в виде выражения, понятного для него. Затем проходит сквозь многослойную операцию и переводится на другой язык.

При таком переводе объем данных должен быть огромным, иначе система окажется бесполезной. Поисковые системы, вроде Baidu или Google, могут собирать перевод из огромного количества человеческих высказываний в интернете. Только такие объемы данных способны прокормить NMT. Система сможет самостоятельно отладить механизм перевода. И результат будет лучше, чем при SMT. Особенно, если будет достаточно информации на языке перевода.

SMT использует локальную информацию. Фраза расчленяется на сегменты. Сегменты обрабатываются и переводятся. И только потом сшиваются вместе. NMT использует общую информацию. Система кодирует фразу полностью (как люди во время перевода сначала читают предложение целиком). А потом на основе закодированной информации генерирует перевод. За счет этого достигается более высокий уровень читаемости текста.

Например, один из важных аспектов в переводе – порядок слов. Китайцы размещают определения перед определяемым словом. А в английском определение находится после. Машины часто путают этот порядок. Преимущество NMT в его способности к обучению порядку слов в языке. Это обеспечивает плавность перевода в длинных предложениях.

Традиционные методы перевода не бесполезны. Каждый из них выполняет свою функцию. Например, при переводе идиом нельзя использовать дословный перевод. Они всегда имеют устойчивое значение. Потребности пользователей интернета разнообразны: перевод разговорного языка, резюме, новостей и прочего. Поэтому одним методом сложно удовлетворить все запросы. Baidu сочетает в себе сразу несколько традиционных методов перевода: перевод, основанный на грамматических правилах, на примерах, на статистике и на нейронных сетях.

В такой модели машинного перевода человек не ищет грамматические правила, а устанавливает математические модели и параметры, чтобы помочь компьютерной сети выявить правила самостоятельно. Когда человек вводит предложение и получает на выходе его перевод, он не думает, что происходит в середине цепочки. Это называется сквозным переводом. Этот удивительный подход называется байесовским, или скрытой марковской моделью. Для решения проблемы здесь используется теория вероятностей.

С помощью байесовского метода распределения информации можно построить модель личности по вероятностным характеристикам. Например, модель мужчины предполагает, что при чтении новостей он остановится на чтении статей, посвященных войне с вероятностью в 40 %. Женская модель – только 4 %. После того как читатель выберет военные новости, в соответствии с формулой Байеса (рис. 1-2), можно более точно рассчитать его пол и другие характеристики, используя другие поведенческие данные и комплексные расчеты. Это «волшебство» математики. Но, конечно, компьютерные нейронные сети используют не только математические методы.


Рис. 1-1. Байес и байесовская формула[2]


Метод использования искусственного интеллекта, подобный машинному переводу, предполагает использования огромных объемов информации. Интернет сейчас способен такие объемы предоставить. Раньше ученые только мечтали о них.

Интернет был создан для того, чтобы облегчить обмен информацией. В результате произошел информационный взрыв, который способствовал ускорению развития искусственного интеллекта.

В качестве доказательства приведу игру в шахматы. В 1952 году сир Сэмюэл написал программу для игры в шашки, чтобы повысить уровень собственного мастерства. Правила игры были относительно просты. И в этом отношении у компьютера было внушительное преимущество перед человеком. Но правила шахмат гораздо сложнее. Когда президент Baidu Чжан Яцин был директором института Microsoft, он пригласил на работу талантливого компьютерщика Сюй Фэн Сюна родом из Тайваня. Этот специалист во времена IBM (International Business Machines Corporation) разработал известного робота под названием «Шахматы втемную». В 1990-х гг. искусственный интеллект не представлял собой разновидность «Шахмат втемную». Его «мудрость» была заключена в суперкомпьютере (с использованием нескольких процессоров и параллельных вычислительных технологий), благодаря которому ИИ побеждал людей-шахматистов, а в 1997 году выиграл партию у Каспарова, чемпиона мира по шахматам. Вскоре после известной игры IBM отправила технологию «Шахматы втемную» в отставку. Чжан Яцин сказал Сюй Фэн Сюну: «Изобрети технологию для игры в Го, а потом найди меня и выиграй». Пока Чжан Яцин не покинул Microsoft, Сюй Фэн Сюн его так и не искал.


На Facebook В Твиттере В Instagram В Одноклассниках Мы Вконтакте
Подписывайтесь на наши страницы в социальных сетях.
Будьте в курсе последних книжных новинок, комментируйте, обсуждайте. Мы ждём Вас!

Похожие книги на "Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google"

Книги похожие на "Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google" читать онлайн или скачать бесплатно полные версии.


Понравилась книга? Оставьте Ваш комментарий, поделитесь впечатлениями или расскажите друзьям

Все книги автора Робин Ли

Робин Ли - все книги автора в одном месте на сайте онлайн библиотеки LibFox.

Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.

Отзывы о "Робин Ли - Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google"

Отзывы читателей о книге "Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google", комментарии и мнения людей о произведении.

А что Вы думаете о книге? Оставьте Ваш отзыв.