Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд Страница 14
- Категория: Компьютеры и Интернет / Прочая околокомпьтерная литература
- Автор: Кристофер Саммерфилд
- Страниц: 111
- Добавлено: 2026-06-05 09:24:36
Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд краткое содержание
Прочтите описание перед тем, как прочитать онлайн книгу «Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд» бесплатно полную версию:Взгляд изнутри на большие языковые модели (LLM), совершающие революцию в наших отношениях с технологиями; исследование их удивительной истории, того, что они могут и должны делать для нас сегодня, и путей их развития в будущем — от пионера в области ИИ и нейробиолога
В этом доступном, актуальном и авторитетном исследовании самой радикальной технологии в мире нейробиолог и специалист в области ИИ Кристофер Саммерфилд изучает, что на самом деле требуется для создания мозга с нуля. Мы вступили в мир, где подкупающе человекоподобные чат-боты, такие как ChatGPT, Claude и Bard, кажутся способными говорить и рассуждать подобно нам — и уже начинают менять все, что мы делаем. Но может ли ИИ «мыслить», «знать» и «понимать»? Каковы его ценности? Чьи предубеждения он закрепляет? Способен ли он лгать, и если да, сможем ли мы это распознать? Угрожает ли их появление самому нашему существованию?
Книга «Эти странные новые разумы» прослеживает эволюцию разумных говорящих машин...
Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд читать онлайн бесплатно
Например, если у вас живет домашний кот, то по мере превращения из котенка во взрослое животное он, скорее всего, освоит несколько впечатляющих трюков — скажем, научится совершать акробатические прыжки на кухонную столешницу, особенно если вам случится оставить там тарелку с курицей. На охоте он умеет скрытно прятаться в высокой траве, выжидая, пока дрозд отвлечется, чтобы совершить молниеносный бросок. В другое время он может пытаться добыть еду демонстрируя привязанность — неистово обвиваясь вокруг ваших ног. Хотя подобное поведение заложено в каждом коте генетически, оно корректируется на протяжении многих месяцев кошачьего взросления: метод проб и ошибок подсказывает ему, в каком месте сада птицы чаще всего пьют воду или сколько именно нужно тереться о ноги, чтобы в ход наконец пошел консервный нож. Но освоив кухонную гимнастику и привыкнув терроризировать местных певчих птиц, кот способен быстро применить свои навыки для совершенно новых целей — запрыгнуть в ящик для носков ради уютного сна, выслеживать в подвале ничего не подозревающих грызунов или донимать гостей с тем несносным упорством, которое обычно приберегает для вас. Даже когда мир меняется изо дня в день, животное, кажется, интуитивно понимает, что делать.
Так как же нам построить нейронные сети, которые справлялись бы с новизной так же легко, как кошка? В процессе обучения информация сохраняется в мозге. Если наши воспоминания — это хранилища знаний о прошлом, как они помогают нам справляться с будущим? Как воссоздать кошачью (и человеческую) способность принимать разумные решения в ситуациях, с которыми мы никогда прежде не сталкивались? Как, к примеру, глубокие сети могут классифицировать новые изображения или переводить новые предложения с одного языка на другой? Как, играя в покер, они могут делать расчетливые ставки при совершенно новых комбинациях карт? Чтобы разобраться в этих вопросах, нам нужно немного глубже погрузиться в то, как на самом деле обучаются нейронные сети.
Нейронная сеть — это разновидность статистической модели. Статистическая модель представляет собой численный инструмент, который можно использовать для аппроксимации набора данных и прогнозирования новых точек данных по мере их появления. Представьте, что я хочу создать приложение, которое прогнозирует время в пути между любыми двумя пунктами назначения в Великобритании. Я начну с «обучающих» данных — большой таблицы, где каждая строка описывает прошлую поездку, а столбцы представляют собой переменные, по которым можно прогнозировать время в пути, такие как пройденное расстояние (обычно обозначаемое как X), а также само время в пути (обычно Y). В процессе обучения нейронная сеть находит функцию, которая предсказывает Y на основе X. Эта функция представляет собой набор чисел (или весов — совсем как в перцептроне Розенблатта), которые при умножении на X и последующем сложении дают оценку Y. Веса сети изначально задаются случайным образом (с чистого листа), поэтому ее первые догадки оказываются совершенно далекими от истины, но с помощью метода под названием «градиентный спуск» веса постепенно обновляются, за счет чего прогнозы улучшаются. Градиентный спуск — это математический прием, использующий математический анализ, чтобы на основе обратной связи от текущего прогноза определить, как скорректировать веса, чтобы следующий прогноз оказался хотя бы немного точнее предыдущего.
В простейшей сети X может представлять собой список расстояний в километрах, а Y — список времени в пути в часах. Таким образом, наилучшим весом для прогнозирования Y на основе X будет одно-единственное число, соответствующее величине, обратной средней скорости поездки (то есть не км/ч, а обратному значению — часам на километр, или часам, деленным на километры). Сжав весь набор данных до одного параметра — одного веса, — я могу использовать его для прогнозирования новых наблюдений. Поездка из Ливерпуля в Кардифф может отсутствовать в обучающих данных, но поскольку я вывел значение веса 1/60 (что означает, что люди едут в среднем со скоростью 60 км/ч), я могу предсказать по расстоянию в 300 км, что путь займет около пяти часов. Эта способность делать успешные прогнозы для новых данных называется «обобщением».
Конечно, прогнозирование времени в пути на основе средней скорости всех поездок — подход крайне упрощенный, и поэтому такое приложение вряд ли пользовалось бы успехом. Разумеется, время, необходимое для того, чтобы добраться из точки А в точку Б, также зависит от того, час пик сейчас или полночь, едете ли вы по извилистым горным проселкам или несетесь по автомагистрали. Мы можем улучшить наши прогнозы, добавив больше переменных (таких как время суток и тип дороги) и подобрав веса для каждого из этих параметров поездки, прежде чем складывать их для получения окончательного прогноза. Именно так работал перцептрон Розенблатта, и для некоторых классов задач этот подход работает довольно неплохо. Однако одно из ограничений заключается в том, что для хороших прогнозов часто требуется знание того, как переменные взаимодействуют друг с другом (например, час пик замедляет движение по пятницам, но в воскресенье его может вообще не быть), а расчет независимых весов для каждого предиктора игнорирует эти нелинейные взаимодействия. Именно эту убийственную критику обрушил Минский на перцептрон, и именно по этой причине исследования нейронных сетей зашли в тупик более чем на десятилетие после 1970-х годов. Глубокие сети оказались успешными потому, что за счет включения множества слоев — в которых X последовательно преобразуется несколько раз — они способны выстраивать исключительно сложные нелинейные функции для отображения X на Y, что зачастую позволяет сети делать поразительно точные прогнозы по данным, которых она никогда раньше не видела.
Способность к обобщению закрепила за глубоким обучением статус доминирующего метода в исследованиях искусственного интеллекта. Научившись строить обобщаемую функцию отображения, глубокие сети могут классифицировать только что сделанные фотографии, переводить оригинальные предложения или выявлять скрытые аномалии на новых медицинских снимках. За последние десять лет были пройдены долгожданные рубежи. Поскольку они способны справляться с неожиданными игровыми ситуациями, глубокие сети теперь превосходят мировых экспертов в таких интеллектуальных играх, как го, покер и Stratego, и могут на равных соперничать с лучшими игроками мира в киберспортивных дисциплинах вроде StarCraft. Способность к обобщению — это также
Жалоба
Напишите нам, и мы в срочном порядке примем меры.