Чарльз Уилан - Голая статистика. Самая интересная книга о самой скучной науке Страница 24
- Категория: Бизнес / Бизнес
- Автор: Чарльз Уилан
- Год выпуска: -
- ISBN: -
- Издательство: -
- Страниц: 82
- Добавлено: 2019-08-13 10:06:09
Чарльз Уилан - Голая статистика. Самая интересная книга о самой скучной науке краткое содержание
Прочтите описание перед тем, как прочитать онлайн книгу «Чарльз Уилан - Голая статистика. Самая интересная книга о самой скучной науке» бесплатно полную версию:Статистика помогает принимать важные решения, находить скрытые взаимосвязи между явлениями, лучше понимать ситуацию в бизнесе и на рынке. Автор книги профессор Чарльз Уилан с юмором и блестящими наглядными примерами рассказывает о том, как это происходит.Эта книга будет полезной для студентов, которые не любят и не понимают статистику, но хотят в ней разобраться; маркетологов, менеджеров и аналитиков, которые хотят понимать статистические показатели и анализировать данные; а также для всех, кому интересно, как устроена статистика.
Чарльз Уилан - Голая статистика. Самая интересная книга о самой скучной науке читать онлайн бесплатно
ДНК у разных людей бывают похожи, как и многие другие характеристики: размер обуви, рост, цвет глаз. (Свыше 99 % ДНК у людей идентичны.) Если в распоряжении исследователей есть только малый образец ДНК, на котором можно проверить лишь пару-тройку участков, то вполне возможно, что у тысяч или даже миллионов людей окажется точно такой же генетический фрагмент. Следовательно, чем большее число локусов будет проверено и чем большее естественное генетическое отклонение будет в каждом из них обнаружено, тем определеннее окажется совпадение. Можно сказать и по-другому: тем меньше вероятность того, что данный образец ДНК совпадет с несколькими людьми{34}.
Чтобы лучше уяснить ситуацию с ДНК, представьте, что ваше «число ДНК» состоит из вашего телефонного номера, присоединенного к номеру вашей карточки социального страхования. Эта последовательность из девятнадцати цифр идентифицирует вас уникальным образом. Допустим, что каждая такая цифра представляет собой «участок» с десятью возможностями: 0, 1, 2, 3 и т. д. Предположим также, что следователи обнаружили на месте преступления остаток некоего «числа ДНК»: _ _ 4 5 9 _ _ _ 4 _ 0 _ 9 8 1 7 _ _ _. Оказалось, что этот фрагмент в точности совпадает с вашим «числом ДНК». Итак, вы – преступник?
Следует обратить внимание на три вещи. Во-первых, все, что меньше чем полное совпадение с полным геномом, оставляет некоторый простор для неопределенности. Во-вторых, чем больше локусов, которые мы можем проверить, тем меньше неопределенность. И в-третьих, важен контекст. Выявленное совпадение было бы чрезвычайно убедительным, если бы нашлись свидетели того, как вы пытались скрыться с места преступления, или если бы у вас в кармане обнаружили кредитную карточку жертвы.
Когда следователи располагают неограниченным временем и ресурсами, типичный процесс включает в себя проверку тринадцати разных локусов. Шансы, что профиль ДНК у двух разных человек совпадает по всем тринадцати локусам, чрезвычайно малы. Когда для идентификации останков, найденных во Всемирном торговом центре после терактов 11 сентября, использовался анализ ДНК, образцы, обнаруженные на месте трагедии, сравнивались с образцами, предоставленными членами семей жертв теракта. Вероятность, требовавшаяся для позитивной идентификации, равнялась один из миллиарда; то есть вероятность того, что останки принадлежат кому-то другому, а не идентифицируемой жертве, не превышает одного шанса из миллиарда. Впоследствии, по мере того как оставалось все меньше и меньше неидентифицированных жертв, с которыми могли бы быть спутаны останки, этот стандарт был ослаблен.
Если ресурсы ограниченны или имеющийся образец ДНК слишком мал или загрязнен, чтобы можно было проверить тринадцать локусов, ситуация становится более запутанной и спорной. В 2008 году газета Los Angeles Times опубликовала серию материалов, посвященных использованию ДНК при расследовании преступлений{35}. В частности, издание задалось вопросом, не недооценена ли возможность случайных совпадений при использовании стандарта вероятности, определяемого законом. (Поскольку профиль ДНК всего населения не знает никто, то вероятности, на которые ссылаются в суде ФБР и другие правоохранительные органы, носят лишь оценочный характер.) Весьма неоднозначную реакцию в обществе вызвала информация о том, что эксперт-криминалист из Аризоны, выполнявший тесты на основе базы данных ДНК этого штата, обнаружил совпадение ДНК на девяти локусах у двух опасных уголовных преступников, не являющихся родственниками; между тем, согласно ФБР, вероятность такого совпадения равна одному шансу из 113 миллиардов. Дальнейший поиск в других базах данных ДНК позволил выявить свыше тысячи пар людей с генетическими совпадениями на девяти и более локусах. Это может служить серьезным поводом к размышлению для правоохранительных органов и адвокатов. Пока же важный для нас урок заключается в том, что анализ ДНК, на который возлагаются столь большие надежды, хорош лишь настолько, насколько надежны значения вероятности, подкрепляющие его.
Зачастую бывает очень полезно знать вероятность одновременного наступления нескольких событий. Какова вероятность исчезновения электричества в сети и выхода из строя автономного генератора? Вероятность одновременного наступления двух независимых событий представляет собой произведение их соответствующих вероятностей. Другими словами, вероятность наступления события A и события B равна вероятности наступления события A, умноженной на вероятность наступления события B. Чтобы вам стало понятнее, приведу соответствующий пример. Если вероятность выпадания орла при однократном подбрасывании монетки составляет ½, то вероятность его выпадания при подбрасывании такой же монетки два раза подряд равняется ½ × ½ = ¼; три раза подряд – ⅛; четыре раза подряд – 1/16 и т. д. (Понятно, что вероятность выпадания решки при подбрасывании монетки четыре раза подряд также составляет 1/16.) Это объясняет, почему системный администратор в вашем учебном заведении или офисе постоянно напоминает вам о необходимости усложнить пароль. Если вы используете шестизначный пароль, состоящий только из цифр, мы можем подсчитать количество возможных паролей: 10 × 10 × 10 × 10 × 10 × 10, что равняется 106, или 1 000 000. На первый взгляд, количество комбинаций настолько велико, что угадать пароль сложно, однако компьютер проверит все эти 1 000 000 вариантов за какую-то долю секунды.
Допустим, системный администратор убеждает вас включить в пароль буквы. На данном этапе для каждого из шести разрядов имеется 36 комбинаций: 26 букв английского алфавита и 10 цифр. Итак, количество возможных паролей возрастает до 36 × 36 × 36 × 36 × 36 × 36, или 366, то есть свыше двух миллиардов. Если ваш системный администратор требует, чтобы пароль состоял из восьми цифр, и призывает использовать символы #, @, % и! как в Чикагском университете, то количество потенциальных паролей увеличивается до 468, то есть свыше 20 триллионов.
Здесь нужно сделать одно важное замечание. Эта формула применима только если события независимы; иными словами, когда исход одного события не оказывает влияния на исход другого события. Например, вероятность того, что в результате первого подбрасывания монетки выпадет орел, не влияет на вероятность исхода второго подбрасывания той же монетки. С другой стороны, вероятность того, что сегодня пойдет дождь, не независима от того, был ли он вчера, поскольку грозовые фронты могут сохраняться на протяжении нескольких дней. Аналогично, вероятность того, что сегодня ваш автомобиль попадет в аварию, и того, что он попадет в нее в следующем году, также не независимы друг от друга. То, что привело к аварии вашего автомобиля в этом году, может спровоцировать ДТП и в следующем году: возможно, вы склонны садиться за руль в нетрезвом состоянии, или вам нравится устраивать гонки на дороге, или строчить эсэмэски во время вождения; наконец, не исключено, что вы просто плохой водитель. (Именно поэтому после каждого очередного ДТП ваша страховая ставка повышается; дело не столько в желании страховой компании компенсировать деньги, выплаченные ею согласно страховому договору, сколько в том, что теперь она располагает новой информацией о вероятности вашего попадания в дорожно-транспортные происшествия в дальнейшем, поскольку – после того как вы, заезжая в гараж, сильно поцарапали свой автомобиль – такая вероятность повысилась.)
Допустим, вас интересует вероятность наступления одного (исхода A) или другого (исхода B) события (опять же предполагая, что они независимы). В этом случае вероятность наступления события A или B равна сумме их индивидуальных вероятностей, то есть вероятность A плюс вероятность B. Например, вероятность выпадания 1, 2 или 3 в результате подбрасывания одной игральной кости равняется сумме их отдельных вероятностей: 1/6 + 1/6 + 1/6 = 3/6 = ½. Это должно быть интуитивно понятно. При подбрасывании игральной кости есть шесть возможных исходов. Числа 1, 2 и 3 в совокупности составляют половину из них. Следовательно, вероятность выпадания 1, 2 или 3 вследствие подбрасывания одной игральной кости равняется 50 %. Если вы играете в кости в Лас-Вегасе, то вероятность выпадания 7 или 11 в результате однократного подбрасывания равна количеству комбинаций, составляющих в сумме 7 или 11, поделенному на общее число вариантов, которые могут выпасть в результате подбрасывания двух игральных костей, или 8/36[24].
Вероятность также позволяет подсчитать математическое ожидание – чрезвычайно полезный инструмент, используемый при принятии любых управленческих решений, особенно в сфере финансов. Математическое ожидание – это среднее значение случайной величины. Математическое ожидание, или отдача (функция выигрыша) от некоторого события, например покупки лотерейного билета, представляет собой сумму всех разных исходов, весовыми коэффициентами при каждом из которых являются вероятность исхода и выигрыш. Как обычно, приведем пример, чтобы прояснить смысл сказанного. Допустим, вам предложили сыграть в кости, причем подбрасывается только одна игральная кость. Функция выигрыша в этой игре такова: 1 доллар, если у вас выпадает 1; 2 доллара, если у вас выпадает 2; 3 доллара, если у вас выпадает 3 и т. д. Каково математическое ожидание в случае однократного подбрасывания игральной кости? Вероятность каждого из возможных исходов равняется 1/6, поэтому математическое ожидание вычисляется так:
Жалоба
Напишите нам, и мы в срочном порядке примем меры.