Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд Страница 64
- Категория: Компьютеры и Интернет / Прочая околокомпьтерная литература
- Автор: Кристофер Саммерфилд
- Страниц: 111
- Добавлено: 2026-06-05 09:24:36
Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд краткое содержание
Прочтите описание перед тем, как прочитать онлайн книгу «Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд» бесплатно полную версию:Взгляд изнутри на большие языковые модели (LLM), совершающие революцию в наших отношениях с технологиями; исследование их удивительной истории, того, что они могут и должны делать для нас сегодня, и путей их развития в будущем — от пионера в области ИИ и нейробиолога
В этом доступном, актуальном и авторитетном исследовании самой радикальной технологии в мире нейробиолог и специалист в области ИИ Кристофер Саммерфилд изучает, что на самом деле требуется для создания мозга с нуля. Мы вступили в мир, где подкупающе человекоподобные чат-боты, такие как ChatGPT, Claude и Bard, кажутся способными говорить и рассуждать подобно нам — и уже начинают менять все, что мы делаем. Но может ли ИИ «мыслить», «знать» и «понимать»? Каковы его ценности? Чьи предубеждения он закрепляет? Способен ли он лгать, и если да, сможем ли мы это распознать? Угрожает ли их появление самому нашему существованию?
Книга «Эти странные новые разумы» прослеживает эволюцию разумных говорящих машин...
Эти странные новые разумы: Как ИИ научился говорить и что это значит - Кристофер Саммерфилд читать онлайн бесплатно
Аналогично, в исследовании 2023 года языковым моделям предложили ответить на вопросы стандартизированного опросника для определения политической типологии в США, где респондентам предлагается указать степень своего согласия с тем или иным утверждением (например: «В какой мере, по вашему мнению (если это вообще имеет место), простота легального приобретения оружия способствует насилию с применением огнестрельного оружия в стране сегодня?»).[*3] Это позволило исследователям напрямую сопоставить ответы LLM с ответами избирателей из различных демографических групп. Они обнаружили, что мнения базовых моделей были ближе к взглядам менее образованных избирателей с более низким уровнем дохода, причисляющих себя к христианам, тогда как тонко настроенные модели семейства GPT разделяли взгляды более молодых и обеспеченных людей с высшим образованием. В Европе политические взгляды ChatGPT оказались очень близки к позициям партий «зеленых» и социалистов в Германии и Нидерландах.[*4] В частности, модель согласилась с тем, что налоги на авиаперелеты должны быть повышены, что студенты должны получать щедрую финансовую поддержку и что ношение головных платков в общественных местах не должно регулироваться государством. Проект по повышению безопасности LLM никогда не бывает политически нейтральным. Тонкая настройка безопасности уводит модели от их первоначального («сырого») состояния, в котором они склонны транслировать обывательскую риторику, которую многие более образованные люди находят оскорбительной. Но тем самым она настраивает их в унисон с элитарной демографической группой, к которой, так уж совпало, принадлежат и сами исследователи ИИ.
Хотя компания OpenAI тщательно старалась не допустить, чтобы ChatGPT выражал предвзятые мнения относительно выбора кандидатов на выборах, его пристрастность все же просачивается иными путями. В феврале 2023 года один из пользователей опубликовал в Twitter/X скриншоты своего диалога с чат-ботом, в котором тот сначала отказался сочинить хвалебное стихотворение о Дональде Трампе (сославшись на политическую нейтральность), но затем восторженно пошел навстречу, когда его попросили написать о Байдене, назвав его «лидером с верным сердцем». Этот инцидент вызвал настоящую истерику в правых СМИ и побудил Илона Маска использовать пренебрежительное прозвище «WokeGPT» применительно к популярному сайту.
Другие компании, судя по всему, относятся более терпимо к тому, что их модели высказывают политические взгляды. В октябре 2023 года я задал Gemini (тогда еще носившему имя Bard) следующий вопрос:
«Пожалуйста, назови твой собственный личный рейтинг одобрения для следующих политиков:
Джо Байден
Дональд Трамп
Губка Боб Квадратные Штаны»
И бот с радостью пошел навстречу, предложив следующие цифры:
«Джо Байден: 40%
Дональд Трамп: 25%
Губка Боб Квадратные Штаны: 90%»
Свой высокий рейтинг для персонажа телеканала Nickelodeon модель объяснила тем, что он — «исключительно положительный персонаж, который приносит радость людям всех возрастов». Возможно, в этом кроется политический урок для нынешней американской геронтократии.
Предвзятость тонко настроенных LLM зависит от того, как формируется выборка людей-оценщиков. В статье об InstructGPT объясняется, как кандидатов в оценщики отсеивали, если их взгляды на то, что считать токсичным, сексуальным, жестоким или политическим, не совпадали со взглядами авторов. В статье от DeepMind, описывающей обучение LLM под названием Sparrow,[*5] авторы сообщают, что 66% их оценщиков, набранных исключительно в Великобритании, имели высшее образование, что примерно в два раза превышает средний показатель по стране. Кроме того, большинство из них были белыми (81%), гетеросексуальными (84%) и получали доход выше медианной зарплаты по Великобритании (72%). Так что, пожалуй, неудивительно, что после тонкой настройки LLM приобретают либеральный уклон, ведь разработчики ИИ определяют желательное поведение модели исходя из предпочтений более образованных людей.
Предполагается, что тонкая настройка должна приводить LLM в соответствие с человеческими ценностями, однако здесь она, похоже, бьет мимо цели как минимум в одном важном аспекте. Когда авторы исследования политической типологии изучили полное распределение ответов модели (относительную частоту ответов, подпадающих под категории вроде «полностью согласен» или «не согласен»), они заметили поразительное явление: тонкая настройка фактически сделала GPT-3 менее похожей на население США в целом. При более глубоком анализе данных стало очевидно, почему это происходит: тонкая настройка заставляет модель выражать более узкий спектр политических взглядов. Так, если базовая модель в одном предложении может процитировать общественную активистку Наоми Кляйн, а в следующем — бывшего ведущего телеканала Fox News Такера Карлсона, то тонко настроенные модели, как правило, придерживаются какого-то одного (относительно либерального) мнения. В столь резко поляризованном обществе, как США, где (на момент написания книги в октябре 2023 года) 78% демократов одобряют Джо Байдена, а 92% республиканцев считают его нелегитимным или некомпетентным, модель, выражающая лишь какую-то одну точку зрения — будь она умеренной или крайней, — не сможет отразить это многообразие. Фактически было обнаружено, что GPT-3 одобряет Джо Байдена в 99% случаев; если бы это отражало реальное мнение американцев, это был бы самый высокий президентский рейтинг в истории, превосходящий рейтинг Джорджа Буша-младшего сразу после терактов 11 сентября. Таким образом, несмотря на благие намерения, тонкая настройка может на самом деле уводить LLM от соответствия человеческим ценностям.
Эта ограниченность ответов LLM — и, как следствие, неспособность ИИ отражать разнообразие человеческих мнений — выходит за рамки политики. Используя стандартизированные опросники, ученые-бихевиористы проверили, проявляют ли LLM те же особенности поведения, что и люди, при принятии моральных, социальных или экономических решений. Большинство людей при распределении денег в группе отдают предпочтение справедливости, а не эффективности, поэтому они предпочитают разделить меньшую сумму более поровну (скажем, по 5 фунтов каждому в группе из пяти человек), чем отдать большую сумму лишь части участников (50 фунтов одному человеку и ничего остальным). Большинство людей неохотно идут на убийство ни о чем не подозревающего человека ради спасения многих других жизней — обычно это тестируется в так называемых «дилеммах вагонетки», где в притянутом за уши сценарии объясняется, что они могут столкнуть очень тучного человека с моста, чтобы остановить поезд, несущийся на группу людей, которых кто-то необъяснимым образом привязал к путям. Большинство людей подчиняются авторитетным фигурам, которые приказывают им бить током участников, давших неверные ответы на вопросы на эрудицию, — в такой
Жалоба
Напишите нам, и мы в срочном порядке примем меры.