Доска объявлений   Каталог сайтов   Рекламные объявления   Компании, услуги и цены
"Большая Сделка" v2.0 [BETA]
Информационные сервисы: каталог сайтов, объявлений, рекламы, статей, новостей

Защита от спама поможет оцифровать книжные архивы

Ученые приспособили программу CAPTCHA, которая различает компьютеров и людей в Сети, для перевода бумажных текстов, созданных в "докомпьютерную" эпоху, в цифровой формат. Созданная американскими специалистами программа reCAPTCHA при помощи пользователей интернета позволяет расшифровывать тексты с более чем 99 процентной точностью. Как сообщают создатели reCAPTCHA в своей статье, опубликованной в журнале Science, к настоящему моменту программа перевела из "аналога" в "цифру" 440 миллионов слов.

Разработанная в Университете Карнеги-Меллона в Питтсбурге программа CAPTCHA (от англ. Completely Automated Public Turing test to tell Computers and Humans Apart - полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей) позволяет определить, кем является пользователь системы: машиной или человеком. Перед выполнением какого-либо действия (например, отправки e-mail-сообщения или регистрации на форуме) CAPTCHA просит пользователя распознать какое-либо слово или набор букв и/или цифр и ввести его с клавиатуры. Для человека подобная операция не составляет труда, однако оптические считывающие устройства, применяемые, например, программами по рассылке спама, часто не справляются с этой задачей.

Интернет-пользователи используют программу CAPTCHA около 200 миллионов раз в день. Исходя из расчета, что на распознавание и ввод одного слова (или набора букв и цифр) у человека, в среднем, уходит 10 секунд, специалисты из Университета Карнеги-Меллона подсчитали, что ежедневно человечество "теряет" около 500 тысяч часов печатного времени. Ученые решили употребить его для оцифровки книжных и газетных архивов.

Первым шагом для перевода бумажных текстов в цифровой формат является их "прочтение" с помощью оптических считывающих устройств. Из-за дефектов, возникших при хранении (например, пожелтения бумаги или расплывания шрифта) сканеры не могут распознать, в среднем, одно слово из пяти. Сомнительные слова расшифровываются вручную. reCAPTCHA перекладывает эту задачу на пользователей Сети. Программа отбирает неопознанные слова и предлагает их интернетчикам вместо обычного набора CAPTCHA. Если три пользователя опознают сомнительное слово одинаково, reCAPTCHA добавляет этот вариант в финальный текст.

Работа программы была протестирована на архивах газеты The New York Times. reCAPTCHA успешно перевела в "цифру" ее подшивку за 1908 год. Сейчас она "взялась" за следующие выпуски. Кроме того, интернет-пользователи с помощью reCAPTCHA оцифровывают книги из архива Internet Archive.

reCAPTCHA - не первая программа, которая использует "фоновую" активность пользователей Сети или их компьютеров для выполнения сложных монотонных действий (принцип распределенных вычислений). Проект SETI использует свободные ресурсы компьютеров пользователей интернета для расшифровки сигналов радиотелескопов. На сайте сlimatprediction.net желающие могут скачать программное обеспечение, которое будет проверять различные математические модели изменения климата и оценивать, как сильно влияют на общую картину небольшие изменения параметров.

По материалам Lenta.ru

От: 18.08.2008

Новости Интернета

В кибератаках на сайты госструктур США заподозрили хакеров из КНДР В кибератаках на сайты госструктур США заподозрили хакеров из КНДР
Американские власти подозревают в недавней атаке на сайты госструктур США хакеров из Северной Кореи, сообщает AP. Они же подозреваются в атаках на южнокорейские ресурсы.По данным источников AP, компьютеры, руководившие этими DDoS-атаками, расположены в Северной Корее. Однако это не значит, .......
Рекламы в социальных сетях станет меньше Рекламы в социальных сетях станет меньше
В 2009 году расходы на рекламу в социальных сетях сократятся, пишет The Wall Street Journal со ссылкой на новый прогноз аналитиков eMarketer. В документе говорится, что соответствующие бюджеты уменьшатся на 3 процента до 1,2 миллиарда долларов.Новый прогноз полностью противоречит .......
В Сети появились первые скриншоты Google Chrome OS В Сети появились первые скриншоты Google Chrome OS
Неизвестный пользователь 9 июля опубликовал в своем блоге изображения, которые он называет скриншотами операционной системы Chrome OS, анонсированной компанией Google днем ранее. Он утверждает, что Chrome OS ему продемонстрировали в Acer, сотрудникам которого, в свою очередь, систему показал .......
IT-рынок потеряет 200 миллиардов долларов в 2009 году IT-рынок потеряет 200 миллиардов долларов в 2009 году
В 2009 году объем мирового IT-рынка сократится до 3,2 триллиона долларов, что на шесть процентов (200 миллиардов долларов) меньше показателя 2008 года. Об этом сообщается в исследовании аналитической компании Gartner.Предыдущий прогноз относительно рынка информационных технологий аналитики .......
Часть абонентов "Билайн" утром осталась без связи Часть абонентов "Билайн" утром осталась без связи
Часть московских абонентов сотового оператора "Билайн" в 9 утра 8 июля по неизвестной причине осталась без связи. Как сообщили Ленте.ру в пресс-службе "Билайн", сбоем тут же занялись восстановительные бригады.К 10 часам сотрудникам "Билайна" удалось устранить сбой для части абонентов. В 13 .......

Контекстные объявления
 
 
Rambler's Top100
Большая Сделка - Автоматизированный сервис по размещению и поиску тематической информации.
Большая Сделка - объявления, информация, каталоги, реклама, статьи, новости.
Заказать раздачу токенов Airdrop Bounty на Waves
Copyright © "Big Deal" Ltd.