Распознавание чертежей при помощи машинного обучения от Технологики

Распознавание чертежей при помощи машинного обучения

Распознавание чертежей при помощи машинного обучения

В настоящее время успех любого бизнеса зависит от способности быстро и легко находить, получать доступ и редактировать данные документов. Обработка реальных документов - это ситуация, которая знакома компаниям любого размера. Она оказывает большое влияние на производительность компании, независимо от отрасли или направления деятельности.

История распознавания документов: От OCR до ИИ

Обработка документов прошла множество этапов в своем развитии. Традиционно вся обработка выполнялась вручную, что имело множество недостатков. Многие компании до сих пор сталкиваются с такими проблемами, как потеря времени на ручное извлечение данных, неправильная маркировка и т.д.

Для решения этих проблем предприятия часто обращаются к современным технологиям. Многие компании не только работают с электронными документами, но и прилагают усилия к тому, чтобы полностью перейти на такие документы.

OCR для оцифровки документов

Несмотря на то, что полный переход на электронный документооборот с каждым годом набирает все большую популярность, большинству компаний все еще приходится переводить физические документы в цифровой формат.

Этот процесс часто включает в себя распознавание символов и шрифтов при помощи AI, распознавание специальных символов, распознавание типов документов и т.д.

Эти задачи решаются с помощью OCR, или оптического распознавания символов, которое помогает:

  • преобразовать физический документ в редактируемый PDF-файл,
  • обнаружить, распознать и подсчитать специальные символы или объекты, присутствующие в документе (что важно для чертежей и поэтажных планов зданий, планировок и т.д.),
  • обнаружить и распознать изображения.

Традиционный OCR имеет существенные ограничения. Качество распознавания документов сильно зависит от исходного качества документа. Извлечение и классификация данных эффективны лишь настолько, насколько качественно отсканированное изображение. OCR часто не может отличить "3" от "8" или "O" от "D". Именно эти проблемы и должен решать OCR. Но вместо этого OCR превращается в новую головную боль, если качество отсканированного документа низко.

Распознавание документов с помощью искусственного интеллекта

В тех случаях, когда приходится выполнять распознавание документов низкого качетсва, в дело вступает искусственный интеллект. Возможности искусственного интеллекта продвинулись настолько, что его можно использовать для распознавания документа, когда традиционный OCR не справляется. Компании, предоставляющие услуги компьютерного зрения на заказ, создают и обучают модели машинного обучения для оптического распознавания символов.

Системы OCR на основе моделей ИИ, также известные как интеллектуальные OCR, обеспечивают гораздо лучшие результаты при распознавании документов, снижая количество ошибок и увеличивая скорость обработки. Распознавание документов с помощью ИИ помогает компаниям оцифровывать документы, которые раньше были сложны для систем OCR (например, чертежи, поэтажные планы, рукописные документы и т.д.).

Ищете ИИ-разработчиков?

Мы создаем ИИ-решения и мы делаем это хорошо. Свяжитесь с нами, чтобы начать разработку вашего проекта сегодня.

связаться с нами

Распознавание поэтажных планов

Планы этажей и чертежи чаще всего обрабатываются вручную из-за их сложной структуры и отсутствия стандартизации. Одним из основных направлений обработки поэтажных планов является определение местоположения различных объектов, таких как двери, окна, электрические розетки, вентиляционные шахты и т. д., а также перевод текста и таблиц в электронный формат для редактирования.

Из-за того, что строительные планы имеют сложную структуру, использование стандартного подхода на основе OCR для распознавания неэффективно.

Инструменты, зарекомендовавшие себя на рынке распознавания текста (такие как ABBYY и Microsoft), которые мы неоднократно использовали для распознавания паспортов, электронных таблиц, штрих-кодов и многого другого, не дают надежных результатов в случае распознавания чертежей.

Распознавание поэтажных планов, по сравнению с распознаванием обычного текста, является более сложной задачей. Потому что они включают в себя специальные символы и аббревиатуры, которые представляют сложность для готовых решений. Для качественного результата стоит разработать систему компьютерного зрения на заказ.

Машинное обучение и искусственный интеллект для распознавания поэтажных планов

Поскольку поэтажные планы - это сложные документы, включающие множество страниц, разделов и элементов, задача оцифровки обычно делится на несколько частей в зависимости от поставленной задачи. Можно оцифровать электронные таблицы, прилагаемые к плану этажа, чтобы отредактировать их, подсчитать, сколько раз тот или иной символ присутствует на странице, распознать текст и многое другое.

Распознавание чертежей: Текст

Информация о типе плана этажа, типе здания, размерах и т.д. - это текст. Обнаружение и распознавание текста - довольно простая задача, когда речь идет о современном компьютерном зрении, однако обнаружение текста на плане этажа является более сложной задачей. Текст, характерный для поэтажных планов, обычно содержит специальные символы, может быть любого размера, шрифта и цвета, а также может быть расположен под любым углом, повернут по размеру или даже перевернут вверх ногами.

Если обычные инструменты обнаружения текста, такие как OCRSpace и IText, могут использоваться с довольно высокой степенью точности для простого текста, но они очень неэффективны при обнаружении текста, расположенного под странным углом, например, размеров объекта. Чтобы добиться хороших результатов обнаружения в таких случаях, необходима разработка системы компьютерного зрения.

Поскольку большинство инструментов OCR можно точно настроить, модуль балансировки может сравнивать различные настройки инструментов и выбирать те, которые дают наиболее точные результаты, а также сравнивать результаты различных инструментов и выбирать лучший из них. Более того, тонкая настройка инструментов OCR может значительно сократить время обработки документов - нам удалось добиться ускорения скорости обработки документов до 200 раз. Использование таких OCR-движков, как Tesseract, позволяет еще больше повысить качество распознавания текста до 99,9% точности.

Распознавание чертежей: Метки и специальные символы

Метки и специальные символы, обозначающие конкретные объекты, такие как двери, окна, электрические розетки и т.д. на чертежах зданий часто необходимо подсчитать для подготовки сметы. Обычно это делается вручную и занимает много времени, также велик фактор человеческой ошибки.

Метки обычно выглядят как геометрические фигуры, которые трудно отличить от их окружения на плане. Вариативность меток, используемых для обозначения одного и того же объекта, также увеличивает сложность обработки.

Готовые решения для компьютерного зрения, такие как библиотеки OpenCV для обнаружения символов, лучше всего работают с цветными фотографиями, на которых изображены объекты реального мира, например, фотографии людей или животных.

Планы этажей черно-белые и состоят в основном из геометрических фигур. Обычные методы OpenCV работают с переменным успехом и часто требуют доработки и усовершенствования для достижения достаточно высокой точности распознавания, достаточной для бизнес-потребностей.

Одной из основных проблем при обнаружении специальных символов на плане этажа являются ложноположительные результаты. Структура поэтажного плана состоит из простых геометрических форм, но и специальные символы и метки тоже, поэтому последние трудно отличить от окружающей среды.

Одним из способов решения этой проблемы является использование методов глубокого обучения или deep learning. Оно может быть реализовано для выявления неточных результатов обнаружения и их устранения.

Распознавание чертежей: Изображения

Некоторые поэтажные планы могут включать изображения, как цветные, так и черно-белые, изображающие фасад здания или его окрестности. Распознавание изображений - одна из самых популярных и, как следствие, более развитых областей компьютерного зрения. Распознавание изображений сильно зависит от объекта, который необходимо найти и классифицировать, поэтому имеет смысл пообщаться с разработчиками машинного обучения, чтобы узнать, как можно воплотить ваш проект в жизнь. Еще лучше сначала получить подтверждение вашей идеи ИИ - не каждая идея может быть реализована в разумные сроки и в рамках бюджетных ограничений.

Заключение

Распознавание плана этажа, как и любой другой проект компьютерного зрения, сильно зависит от бизнес-потребностей, стоящих за ним. Он может быть простым, как обнаружение небольшого блока текста, или сложным, как создание полностью автоматизированной спецификации путем обнаружения и подсчета всех объектов, присутствующих на этаже, независимо от используемых меток. Любой хороший проект начинается с изучения и проверки идеи, чтобы вы знали, возможно ли вообще реализовать задуманное.

Другие типы документов, такие как формы, заполненные от руки, контакты, электронные таблицы PDF и многие другие, могут потребовать различных подходов к решению конкретных проблем обнаружения, но общий подход к оцифровке любого документа остается неизменным. Всегда стоит сначала поговорить с командой разработчиков, чтобы понять, насколько прост или сложен ваш проект и сколько времени и денег он потребует.

Напишите нам!

И мы найдём решение для вашего бизнеса!

связаться с нами

Как создавался умный агрегатор новостей LifeLines
10 критериев надежного партнера по разработке программного обеспечения

другие наши новости

Анализ спутниковых снимков для американского агентства недвижимости

Анализ спутниковых снимков для американского агентства недвижимости

Система по распознаванию чертежей для бюро строительной экспертизы

Система по распознаванию чертежей для бюро строительной экспертизы

Как мы распознавали цвета  медицинских тест-полосок с помощью ИИ для healthcare стартапа

Как мы распознавали цвета медицинских тест-полосок с помощью ИИ для healthcare стартапа

ИИ дороже, чем вы думаете

ИИ дороже, чем вы думаете

Распознавание диалоговых пузырей на рисунках манги

Распознавание диалоговых пузырей на рисунках манги

Сервис для обнаружения лесных пожаров

Сервис для обнаружения лесных пожаров

Как мы применили ai для диагностики туберкулёза

Как мы применили ai для диагностики туберкулёза

Как мы создавали мощный сервис для обучения нейронных сетей в помощь разработчикам и бизнесу

Как мы создавали мощный сервис для обучения нейронных сетей в помощь разработчикам и бизнесу

Приложение для обработки резюме на базе LLM для кадрового агентства

Приложение для обработки резюме на базе LLM для кадрового агентства

Давайте найдем решение для вашего бизнеса!

Давайте найдем решение для вашего бизнеса!

Пожалуйста, заполните 'Имя'
Пожалуйста, заполните 'Телефон'
Пожалуйста, заполните 'Емейл'
Пожалуйста, заполните 'Сообщение'

Пожалуйста, заполните 'Имя и фамилия'
Пожалуйста, заполните 'Телефон'
Пожалуйста, заполните 'Емейл'
Выберите файл
Пожалуйста, выберите файл 'Резюме'
Выберите файл
Пожалуйста, прикрепите файл 'Код / ТЗ'