Реферат на тему:


Воспользуйтесь поиском к примеру Реферат        Грубый поиск Точный поиск






Загрузка...

Курсовая работа

по дисциплине:

Информационная техника

Тема. Автоматизация работы в офисе. Распознавание документов в программе Fine Reader.

Содержание

Введение.

Средства создания электронного документооборота.

Автоматизация ввода информации в компьютер.

Автоматическое распознавание текста.

Программы распознавания текста.

Распознавание документов в программе Fine Reader.

Окно.

Порядок распознавания текстовых документов.

Сканирование документов.

Сегментация документов.

Распознавание документа.

Особенности настройки программы Fine Reader.

Перевод Web-страниц.

Хранение переведенных документов.

Заключение.

Литература.

Введение

С момента появления на свет ПК в мире существовало много видов таких машин. Но теперь большое количество персональных и домашних компьютеров относятся к типу "IBM РС".

Главная заслуга ИВМ - в изготовлении и установлены единого стандарта на основные части компьютера. К тому каждый производитель ПК создавал собственное уникальное "Железо" - том, что в результате он становился монополистом на сбор и обслуживание своих приборов. Но в результате рынок был переполнен общими друг с другом общими аппаратами, для каждого из которых нужно было создать собственные программы. В период установления рынка персональных компьютеров, приборы каждого ПК было тайной фирмы - производителя, и о никакой копирования одной фирмой производителя второй в массовых масштабах просто не могло.

Ввести со сканера текст в компьютер - задача не очень трудное. Но работать с таким текстом невозможно, как и любое сканирование изображения, страница с текстом является графическим файлом. Отсюда и возникают проблемы: во-первых, в графическом формате страница занимает слишком много места. И вторая, самая главная проблема отсканированный текст будет только читать, но редактировать и вставлять его франгменты в созданный документ. Но сам сканер распознавать буквы, как буквы не умеет, они для него всего лишь точки черного цвета. На свете есть программы, которые переводят исходный текст из графического в текстовый формат - программы распознавания текста или OCR. Современная OCR должна уметь очень много, распознавать тексты набранные не только определенными шрифтами, но и самыми разными шрифтами, а также рукописные. Уметь работать с текстами, содержащими слова на нескольких языках, и правильно распознавать таблицы. И самое главное распознавать не только четко набранные тексты, но и непонятные, нечетко набранные тексты. Например, текст с пожелтевшей газетной вырезки или машинописной копии. Само собой распознать текст это лишь полдела. Не менее важно обеспечить возможность хранения результата в файле популярного текстового или табличного формата.

Средства создания электронного документооборота

Современное общество не может существовать без документооборота. Документы сопровождают нас на каждом шагу. Даже имела покупка товара в магазине сопровождается выдачей документа - кассового чека.

Каждый день в мире создаются миллиарды копий больших и малых документов. На изготовление документов расходуется очень большое количество бумаги и леса, а на регистрацию, проверку и хранение документов тратится очень много времени.

Одна из основных задач информатики состоит в разработке и применении методов используя вычислительную технику для перевода документооборота с бумажной формы в электронную. Современные сетевые технологии позволяют решить эту задачу, но только частично. Все банки мира уже связаны электронными сетями и финансовые документы циркулируют в основном в электронном виде. Постоянно выходят из употребления бумажные акции предприятий и другие цене бумаги. Их заменяют электронные дипозитарии - базы данных, в которых сведения об акционерах хранятся в виде записей.

Сравнительно недавно появились электронные деньги. Это тоже записи в базах данных. Движение электронных денег происходит по без бумажной технологии путем переноса данных из одних записей в другие. Для персонального использования электронных денег служат пластиковые карточки, на которой есть сведения о владельце электронного счета на магнитной полосе, или смарт-карте, в которых есть данные записи на большой плоской микросхеме встроенной в карте.

По без бумажной технологии сегодня работают большинство средств массовой информации. Все этапы подготовки газеты, журнала, книги или рекламной листовки проводят на компьютере. Операционная система типа Windows 9х, позволяет одновременно готовить и редактировать тексты, создавать и обрабатывать иллюстрации, а компьютерные сети объединяют всех участников, работающих над одним проектом в автономные рабочие группы. Рабочая группа может обходиться без бумажных документов до полного завершения работы над проектом. Только когда работа заканчивается создается заключительный бумажный документ. Это может быть, как макет газеты так и полный комплект чертежей необходимых для изготовления данного документа.

В тех случаях, когда исходные данные сразу имеют электронный вид, перевод документооборота на без бумажную технологию происходит сравнительно просто. Представим, что писатель написал книгу в текстовом редакторе Word, а художник нарисовал к ней иллюстрации в векторном редакторе Adobe IIIustrator. Представим, что фотограф подготовил необходимые фотографии цифровой фотокамеры и сделал их в редакторе Adobe Photoshop. В таком случае остается только собрать исходные электронные документы в один заключительный документ с помощью издательской системы. Все этапы редактирования и корректоры также выполняют в электронном виде с помощью специальных программных средств. Работа передается с одного рабочего места на другое по компьютерной сети, и все участники работы помогают друг, другу и исправляют ошибки коллег без создания бумажных документов.

Возможно в далеком будущем, когда все документы будут сразу готовиться только в электронном виде, человечество сможет перейти полностью к безбумажной технологии и остатки лесов будут спасены, от полного уничтожения, а целлюлозно-бумажные комбинаты перестанут выбрасывать загрязненные воды в реки и озера . Сегодня ПК есть не на каждом рабочем месте и не все участники документооборота объединении компьютерными сетями в рабочие группы. Поэтому основной задачей на пути создания без бумажной технологии проблема ввода исходных данных в электронном виде. В информатике эта проблема решается созданием и внедрением специально аппаратных средств для перевода графической и текстовой информации в электронную форму.

Автоматизация ввода информации в компьютер

Основным методом перевода бумажных документов в электронную форму является сканирование. Сканирование - это технологический процесс, в результате которого создается графический образ бумажного документа. Существует несколько видов сканеров, но в их основе лежит один и тот же принцип. Документы освещаются светом от специального источника, а отраженный свет воспринимается свет отражающим элементом. Минимальный элемент изображения передается сканером, как цветная точка. Таким образом в результате сканирования документа создается графический файл в, котором хранится растровое изображение первичного документа. Растровое изображение состоит, как известно из точек. Количество точек определяется как размером изображения так и расширением сканера.

Автоматическое распознавание текста

После обработки документа сканером получается

Загрузка...

Страницы: 1 2 3 4