Microsoft Office Document Imaging

Microsoft Office Document Imaging
см. также Microsoft Document Imaging Format

Microsoft Office Document Imaging (MODI) входит в состав пакета Microsoft Office для поддержки редактирования документов, отсканированных в Microsoft Office Document Scanning. Впервые появился в Microsoft Office XP и включался в поздние версии офиса, включая Office 2007. Более не доступен в Office 2010. MODI позволяет распознавать отсканированные документы.

MODI может читать и писать небольшие изображения формата TIFF. Он также может сохранять распознанный текст в оригинальный TIFF файл. Однако, MODI создаёт .tif файлы которые нарушают стандартны формата TIFF[1] и они могут быть использованы только в пакете Microsoft Office[2].

По умолчанию, движок OCR требует правильной ориентации страницы при распознавании. Если вызвать метод objectname.save(), он может записать исправленное положение страницы в исходный файл.

Точность распознавания этого движка невысокая, и для серьёзного применения он мало годится. К тому же он предъявляет высокие требования к качеству входных изображений.

Содержание

Программирование

Через интерфейс COM, MODI предоставляет интерфейс объектной модели, типа документ или изображение. Одна особенность которая представляет практический интерес, это возможность встраиваться в Web интерфейс и распознавать изображения использую встроенный механизм распознавания изображений.

Объект MODI доступен из средств разработки, через программный интерфейс модели COM. Элементы управления MODI доступны через средства разработки которые поддерживают интерфейс ActiveX и использование таких элементов управления. Программный модуль реализующий такой функционал должен быть добавлен в проект, он называется, Microsoft Office Document Imaging Viewer Control 11.0 или 12.0 (MDIVWCTL.DLL). Эти папки обычно находятся в %programfiles%\Common Files\Microsoft Shared\MODI.

MODI стал доступен в MS Office 2003, в то время как связанные программы стали доступны в MS Office XP, объектная модель движка не предоставляет элементов управления, только элемент просмотра.

Пример использования на Visual Basic .NET:

Dim inputFile As String = "C:\test\multipage.tif"
Dim strRecText As String = ""
Dim Doc1 As MODI.Document
 
Doc1 = New MODI.Document
Doc1.Create(inputFile)
Doc1.OCR()  ' распознавание всех страниц, если файл многостраничный
Doc1.Save() ' сохранение переориентированное изображение в оригинальный файл и текст туда же, обратно во входной файл
 
For imageCounter As Integer = 0 To (Doc1.Images.Count - 1) ' срабатывает на кождой странице
    strRecText &= Doc1.Images(imageCounter).Layout.Text    ' помещение результатов работы в строку
Next
 
File.AppendAllText("C:\test\testmodi.txt", strRecText)     ' сохранение распознанного файла на диск
 
Doc1.Close() ' очистка
Doc1 = Nothing

Изменения с Office 2003 SP3

В Office 2003 Service Pack 3, Microsoft исключила ассоциации с файлами типа .TIF and .TIFF с приложением Microsoft Office Document Imaging, как часть пакета исправления проблем безопасности. Также, TIFF файлы более не используют JPEG сжатие.[3]. Никаких объяснений на этот счёт дано не было.

В Office 2010 MODI полностью отвергнут. Это изменение также затронуло дерево установки, которое не показывает пункт MODI Help, OCR. Internet Fax feature в Office 2010 используют Windows Fax драйвер принтера для генерации изображений формата TIF. MODI и все его компоненты убраны в версии офиса для 64-bit Office 2010.[4]

Альтернатива MODI для Office 2010

Если MODI всё же нужен в Office 2010, вот несколько советов (среди прочих):

  • Следуя рекомендациям Microsoft, установите MODI из Office 2007, выбрав в установщике только его. (Этот процесс инсталляции работает и с более ранними версиями Office): http://support.microsoft.com/kb/982760
  • Установите Alterna-TIFF viewer: ActiveX элемент для IE или плагин для браузера (для других браузеров): http://www.alternatiff.com/
  • Установите Black Ice’s TIFF Viewer и плагин: http://www.blackice.com/TIFFViewer.htm
  • Установите Cartesian Product’s CPC viewer: CPC View ax (ActiveX для IE) или CPC Lite pi (плагин для других браузеров): http://www.cartesianinc.com/Products/CPCLite/

Примечания

Ссылки



Wikimedia Foundation. 2010.

Игры ⚽ Нужно решить контрольную?

Полезное


Смотреть что такое "Microsoft Office Document Imaging" в других словарях:

  • Microsoft Office Document Imaging — see also Microsoft Document Imaging Format Microsoft Office Document Imaging (MODI) is a Microsoft Office application that supports editing documents scanned by Microsoft Office Document Scanning. It was first introduced in Microsoft Office XP… …   Wikipedia

  • Microsoft Office Document Imaging — Das Microsoft Office Document Imaging (MODI) gehört zu den Office Tools von Microsoft Office und ermöglicht das Scannen von Dokumenten sowie deren Bearbeitung. Dabei ist auch eine Texterkennung enthalten. Die Dokumente werden im Dateiformat .MDI… …   Deutsch Wikipedia

  • Microsoft Office Document Scanning — ( MODS ) is a scanning and OCR application included with Microsoft Office. The OCR engine is based upon Nuance s OmniPage. Microsoft Office Document Scanning is suited for creating archival copies of documents.Microsoft Office Document Scanning… …   Wikipedia

  • Microsoft Office shared tools — are software components that are (or were) included in all Microsoft Office products. Contents 1 Clip Organizer 2 Graph 2.1 History 3 Equation Editor …   Wikipedia

  • Microsoft Office — Developer(s) Microsoft Initial release November 19, 1990; 21 years ago ( …   Wikipedia

  • Microsoft Office 2010 — applications shown on Windows 7 (clockwise from top left: Word, Excel, OneNote, PowerPoint; t …   Wikipedia

  • Microsoft Document Imaging Format — Extension .mdi Type MIME image/vnd.ms modi Développé par Microsoft Type de format Format de fichier d image Extension du TIFF …   Wikipédia en Français

  • Microsoft Document Imaging Format — see also Microsoft Office Document Imaging Microsoft Document Imaging Format Filename extension .mdi Internet media type image/vnd.ms modi Magic number 0x5045 Developed by Microsoft …   Wikipedia

  • Microsoft Document Imaging — Das Microsoft Office Document Imaging (MODI) ist ein Dateiformat (.MDI) für gescannte Dokumente, das von der Firma Microsoft entwickelt wurde. Dateien im MDI Format werden mit dem Microsoft Office Document Imaging Druckertreiber erzeugt. Dieser… …   Deutsch Wikipedia

  • Microsoft Document Imaging Format — Das Microsoft Office Document Imaging (MODI) ist ein Dateiformat (.MDI) für gescannte Dokumente, das von der Firma Microsoft entwickelt wurde. Dateien im MDI Format werden mit dem Microsoft Office Document Imaging Druckertreiber erzeugt. Dieser… …   Deutsch Wikipedia


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»