Коллектив Авторов - Цифровой журнал «Компьютерра» № 186 Страница 10
- Категория: Компьютеры и Интернет / Прочая околокомпьтерная литература
- Автор: Коллектив Авторов
- Год выпуска: неизвестен
- ISBN: нет данных
- Издательство: неизвестно
- Страниц: 24
- Добавлено: 2019-05-28 16:15:07
Коллектив Авторов - Цифровой журнал «Компьютерра» № 186 краткое содержание
Прочтите описание перед тем, как прочитать онлайн книгу «Коллектив Авторов - Цифровой журнал «Компьютерра» № 186» бесплатно полную версию:ОглавлениеКолонкаОт бондианы до мистификации: уроки толстого «Сигги» Автор: Сергей ГолубицкийРяд соображений о мотивации детей индиго на службе Органов Автор: Сергей ГолубицкийМыслеобмен и охота к перемене мест Автор: Василий ЩепетнёвГолубятня: Очарование и ужас идеального мира Автор: Сергей ГолубицкийДвойной блеф светлого будущего, которого не будет Автор: Сергей ГолубицкийСтарина Икан, Apple и пропасть на горизонте Автор: Сергей ГолубицкийГолубятня: Страда расставаний и счастливых открытий Автор: Сергей ГолубицкийКультурно адаптирующиеся оппортунисты, или О разнообразии экологических ниш <em>Homo sapiens</em> Linnaeus, 1758 Автор: Дмитрий ШабановIT-рынок(DZ) Давид Ян: «Я думаю, что люди, которые толкают науку и бизнес вперёд, в определённой степени безумны» Автор: КомпьютерраМладший брат «Айфона»: какими будут iPhone 5S и 5C Автор: Андрей ПисьменныйЖива ещё моя старушка! Почему Windows XP до сих пор ТАК популярна Автор: Евгений ЗолотовРубежи e-commerce: к каким «контрольным цифрам» стоит стремиться отечественной электронной коммерции? Автор: Михаил ВаннахПромзонаОчки, похожие на Google Glass, позволяют управлять планшетом так, как если бы он висел в воздухе Автор: Николай МаслухинЭти кристаллы способны впитывать воды в 500 раз больше собственного веса и позволяют консервировать ее впрок Автор: Николай МаслухинСтранное будущее: костюм для симбиоза человека и водорослей Автор: Николай МаслухинReebok выпустила датчик ударов по голове для спортсменов Автор: Николай МаслухинАвтомобильный Foursquare от Volkswagen: приложение будет отмечать ваши поездки и выдавать значки достижений Автор: Николай МаслухинТехнологииСеребряная пуля: Элон Маск раскрыл секреты Hyperloop Автор: Евгений ЗолотовИскусственная кожа: как научить роботов чувствовать и зачем это делать Автор: Андрей ВасильковКриптопочта Эдварда Сноудена и контратака на правительство Гехана Гунасекары: история продолжается! Автор: Евгений ЗолотовДаёшь киношку: материализация магнитных вихрей-скирмионов может пригодиться при переходе на видеоформат 4К Автор: Михаил ВаннахСамодостаточная коммуникация: без проводов и батарей Автор: Андрей ВасильковПочему социальная сеть Google+ лучше, чем Facebook: восемь очевидных преимуществ Автор: Олег НечайЦиферкой ошиблись! Как мелкий баг в софте поставил подножку всему миру Автор: Евгений ЗолотовСемь ненужных и даже вредных функций Facebook, которых не должно существовать Автор: Олег НечайНавигация 2.0: как обманывают GPS и восстанавливают истину Автор: Андрей ВасильковС Тором шутки плохи: как поймали Эрика Маркеса и почему не слышно критиков РПЦ? Автор: Евгений ЗолотовГидQuip — современный текстовый редактор для мобильных пользователей Автор: Андрей ВасильковРоссийский сервис Yep поможет найти интересного человека в любое время Автор: Михаил Карпов
Коллектив Авторов - Цифровой журнал «Компьютерра» № 186 читать онлайн бесплатно
То есть в системе заложены главным образом связи между понятиями смысловой близости. Кстати, в нашей команде работают люди, мыслящие на нескольких языках; с ними мы пытаемся анализировать параллельные тексты. При этом мы стараемся вычленить из этой естественной формы языка все наблюдаемые семантические классы, отнести наиболее конкретные из них на более низкие уровни, более общие — на верхние ступени иерархии. Например, семантический класс «средство передвижения» расположен выше классов «наземный транспорт», «воздушный транспорт» и «другой транспорт». Конечно, выстраивание таких цепочек — творческий процесс. Скажем, есть множество возможностей для встраивания в иерархию омонимов: «тополь» — это ведь и растение, и средство вооружения. Собственно говоря, из-за большого числа значений каждого слова в системе семантических категорий так много горизонтальных связей.
В целом работа системы включает ряд сложных этапов: лексико-морфологический анализ, грубый и точные синтаксический анализ, семантический анализ, синтаксический синтез, синтез линейного порядка и, наконец, морфологический синтез. Не буду вдаваться в подробности, и без того очевидно, что задача очень сложная — и именно потому очень многие считают интерлингвистические подходы невозможными…
Д. З. Но ведь это — как спор математиков и инженеров: первым решение кажется всегда недостижимым, вторые — уверены, что найдут реальное решение, которое выполнит задачу на 99%.
Д. Я. В прикладной лингвистике действительно много «подводных камней». Например, появляются новые семантические концепты; то, какими они будут, никогда нельзя предсказать. Скажем, концепт «социальная сеть»: раньше только на каком-то высочайшем уровне абстракции его можно было сопоставить с концептом «средство общения», сегодня же в этом сочетании — вполне конкретный смысл.
Мы уверены, что, обработав таким способом критическое число параллельных текстов на двух языках, мы «устаканим» иерархии. Сейчас над этим работает команда из трёхсот человек; в общей сложности в такой масштабный проект компания ABBYY вложила уже более $70 млн.
Д. З. ABBYY развивает бизнес в двух направлениях — распознавание документов и перевод текстов. Смерть рынка OCR — наверное, вопрос 5–10 лет, а на глобальном рынке услуг перевода и лингвистических технологий вас ждёт Google. Нет ощущения, что впереди у ABBYY — бетонная стена?
Д. Я. Для нас уже давно вся эта сложная работа по созданию формализованных описаний различных языков — не самоцель; мы видим конкретные перспективы применения продуктов на основе этих технологий на рынке. И «Гугл» на самом деле семантика и лингвистика пока мало интересуют: здесь пока для него не слишком денежный рынок.
Начиная в 1995 году проект, мы поставили цель — создать один из лучших машинных переводчиков, способный помочь специалистам переводить большее количество текстов за счёт редактирования результатов машинного перевода, а не путём перевода всего текста целиком.
Рынок перевода уже сегодня оценивается в $20 млрд, а в ближайшем будущем для группы из 10 языков (в основном агнлоцентричных) он вырастет вдвое.
Но параллельно в процессе работы мы открывали новые направления монетизации нашей технологии, в частности в области понимания, поиска и анализа текстовой информации. Именно эта область для нас коммерчески целесообразна сегодня — и мы планируем активно заниматься ей. Но и о переводе мы не забываем. Здесь важно сказать, что с технологической точки зрения машинный перевод является чуть ли не вершиной искусственного интеллекта; получить очень хороший перевод — действительно сложная задача.
Например, то, что мы научились вычленять факты из текстов и проводить анализ документов, выводит нас на рынок «умного» корпоративного поиска. В качестве иллюстрации: в США огромное количество судебных процессов между крупными компаниями, в рамках которых каждая из сторон должна предоставить всю внутреннюю электронную переписку, всю документацию по бизнесу — в электронном виде. Наша система может производить анализ всего этого массива текстовой информации — и выводить юристам и экспертам лишь конкретные результаты. Только этот рынок уже на сегодняшний момент оценивается в несколько миллиардов долларов.
Д. З. Речь идет о семантическом поиске?
Д. Я. По сути, да. Адвокаты и прокуроры пока ищут в судебной документации важные факты, основываясь на key words search либо на поиске с учётом синонимов. Это неэффективно: с одной стороны, точность результатов поиска низка (основаная причина — многозначность слов) с другой — очень многие действительно важные вещи просто пропускаются.
Мы готовы предложить намного более эффективную альтернативу. Скажем, адвокат берёт текст искового заявления и просит нашу систему найти судебные разбирательства, схожие по предмету иска. То есть мы можем автоматизировать процесс поиска прецедента, на котором базируется вся англосаксонская правовая система. Другая сфера применения — патентный анализ, где количество заявок и выданных свидетельств о правах интеллектуальной собственности растёт бешеными темпами. И тому подобное.
Д. З. Очевидно, что следующий шаг вхождения таких технологий в жизнь — диалог с клиентом в семантических терминах. А для этого нужна публичная поисковая система. Вы хотите двигаться в этом направлении?
Д. Я. Мы всегда развивали ABBYY как технологическую компанию — больше были ориентированы на предоставление рынку базовых платформ, которые уже наши партнёры «упаковывали» бы в конкретные продукты. Такая стратегия открывает перед бизнесом огромные возможности масштабирования. Да, конечно, у нас есть свои продукты, но если появляется кто-то, кто хочет сделать конкурентные решения на основе наших технологий, — мы, скорее всего, «подвинемся». Это модель во многом схожа с тем, как работают дистрибьюторы: ведь вендор не выходит на один рынок со своими реселлерами…
Пока от партнерской модели из лидеров рынка отказывается разве что Apple: на данном этапе компания преуспела, но я думаю, что это временно. Если в ближайшие 5–10 лет Apple не станет технологически открытой корпорацией — она просто не сможет сдержать натиск Google, Samsung и Microsoft.
Д. З. Apple сейчас начинает лицензировать технологию Apple AirPlay: разве это не первый шаг к открытости? И, вообще говоря, может быть, модель Apple верна? Ведь Open innovation приводит к тому, что новые технологии начинают «допиливать» множество разработчиков — которые не чувствуют давления со стороны стандарта. В итоге на выходе (и это сейчас видно в ситуации c Android-приложениями) — масса плохих реализаций одной хорошей технологии.
Д. Я. Чтобы уйти от конкретных имен игроков рынка, я скажу, что истина, как всегда, посередине. Это как антагонизм демократического и тоталитарного политических режимов. Закрытый подход Apple очень похож на победу тоталитарного коммунизма в Сингапуре: премьер-министр Сингапура Ли Куан Ю доказал всем, что жесткими авторитарными методами можно вывести нищую страну без природных ресурсов из руин, избавиться от наркомафии и коррупции. Но я не уверен, что такое политическое устройство может быть успешным на очень долгое время. Весь мир ведь понимает, что если сейчас власти Сингапура не переведут страну к одной из форм управляемой демократии – государство может рухнуть.
На другом полюсе — естественное развитие рынка, «дикий» капитализм, где демократические инструменты развиваются стихийно. В каких-то странах это работает, в каких-то народ голосует за популистские реформы, что приводит к бегству капитала и сильных управленцев (почитайте недавнюю историю дефолта города Детройта, а также историю про кризис на юге Европы). Уверен, что истина, как и везде, — в противостоянии этих явлений. Экосистема Apple должна грамотно становиться более открытой, экосистема Android должна грамотно становиться более закрытой.
Еще пример. Цинь Шихуан-ди, китайский император III века до н.э., объединил отдельные провинции Китая, дал отпор кочевникам, построил Великую Китайскую стену и фактически создал единое государство Китая. Но одновременно он казнил тысячи людей, сжёг все книги в государстве, потому что считал: если в них написано то, о чём говорит он сам, — они не нужны, а если они противоречат тому, о чём говорит он, то не нужны тем более. Считать ли Цинь Шихуан-ди (или Ивана Грозного, с которым проводят параллели) однозначно положительными героями мировой истории? Вопрос чрезвычайно сложный. Они создавали великие государства, но убивали миллионы. Слава богу, что «технологические тираны» и «технологические религиозные лидеры», к которым можно отнести Джобса, никого не убивали. И в этом смысле я уверен, что появление Apple и Стива Джобса — огромное счастье для человечества, хотя я сам не причисляю себя к фанатикам Apple. Великие технологические лидеры действительно умеют мобилизовать все доступные ресурсы и «зажечь» своими идеями людей, пусть и навязав им фантастичный миф, — и это, несомненно, приводит к качественному скачку в развитии общества.
Жалоба
Напишите нам, и мы в срочном порядке примем меры.