Xerox признала наличие ошибки с заменой текста в ее копировальной технике

Подробную информацию об ошибке на днях опубликовал германский исследователь Дэвид Кризель. Вкратце, суть ее состоит в том, что при определенных условиях в отсканированных копиях одни текстовые фрагменты могут заменяться другими. Избирательность подобных явлений непонятна и потенциально они могут затронуть любую информацию, в т.ч. финансовую и пр.

В ИТ нередко встречаются совершенно невероятные ошибки и над ними вполне можно было бы всласть посмеяться, если бы они потенциально не вели к очень неприятным проблемам. На первый взгляд нынешняя история похожа на шутку, именно в таком ключе ее поначалу и восприняли представители германского отделения Xerox.

Но явление, обнаруженное и описанное Дэвидом Кризелем, похоже, уже было воспроизведено и другими. Суть его в том, определенные модели копиров Xerox в некоторых случаях произвольно подменяют цифровые данные в отсканированных документах. Точнее, не совсем произвольно, а заменяют одни фрагменты на другие. И речь именно о графических копиях, а не о результатах работы OCR, где ошибки были бы вполне понятны. Так, в одном случае были изменены площади комнат на плане квартиры, в другом – внесены «коррективы» в финансовые данные.

Пока подозрения падают на реализацию в устройствах Xerox алгоритма JBIG2, предназначенного для компрессии черно-белых изображений. Он выделяет похожие на текстовые фрагменты изображения, ищет между ними сходные и заменяет их неким эталоном. Так или иначе, ошибка несомненно будет локализована и исправлена, но как быть со «скорректированными» документами, которые уже могли пойти в работу?

Инженеры Xerox фактически признали наличие ошибки, хотя и уточняют, что она не проявляется при заводских настройках, но может иметь место при снижении параметров качества и разрешения. Подробнее о реакции Xerox можно прочитать тут - http://realbusinessatxerox.blogs.xerox.com/2013/08/06/always-listening-to-our-customers-clarification-on-scanning-issue/?CMP=SMO-EXT#.UgkjsmRI_Eq. Виновником считается алгоритм компрессии JBIG2.

До окончательного решения проблемы рекомендуется использовать заводские настройки, в частности, уровень качества «higher». При понижении последнего веб-интерфейс устройства будет предупреждать о возможных проблемах: «The normal quality option produces small file sizes by using advanced compression techniques. Image quality is generally acceptable, however, text quality degradation and character substitution errors may occur with some originals».