Клиент - крупная китайская компания, занимающаяся производством оборудования для электростанций. Производство в Китае, но оборудование поставляется по всему миру. Поэтому перед заказчиком встала задача перевода технической документации на международный английский язык. Переводить её силами переводчиков оказалось дорого и долго, учитывая большую номенклатуру производства.
Основная задача проекта — автоматизация процесса перевода с китайского на английский язык с сохранением структуры документа и обработкой текстов на схемах и изображениях. Такое решение позволяет значительно сократить время и затраты на перевод.
Данный проект отличается одной важной особенностью. Заказчику было необходимо конфиденциальное решение, которое не будет отправлять закрытые данные третьим лицам или языковым моделям для обучения на открытых данных.
Для выполнения данного условия мы обратились к связке двух решений Azure Intelligence и GPT-4o. Ведь и Azure и GPT-4 имеют гибкие настройки безопасности: предоставляют корпоративным клиентам специальные условия, гарантируя, что данные не будут использоваться для улучшения и обучения моделей или передаваться третьим лицам.
Алгоритм работы ии-решения включает следующие этапы:
Тексты в документации присутствуют в различных форматах: в виде абзацев текста, в заголовках, колонтитулах и в таблицах. Со всеми этими элементами работает GPT-4o.
Мы применяли следующий алгоритм для работы с ними:
Отдельным вызовом для нас стал контроль объема текста, поскольку китайский и английский языки сильно различаются и длина фраз может значительно отличаться. Чтобы решить данную проблему мы адаптировали изначальную структуру документа, в зависимости от полученных объемов переведенного текста.
Также для точности перевода заказчик предоставил нам глоссарий, что позволило сильно улучшить качество переведенных текстов.
Поскольку изображения и схемы тоже содержат текстовые данные, нельзя их обойти стороной, создавая новую документацию для другого рынка сбыта. Мы применяли Azure Intelligence для распознавания текстов на изображениях.
Алгоритм работы с изображениями был следующим:
Заменяем тексты на картинках на переведенные версии, учитывая доступное пространство для текста - Azure Document Intelligence при распознавании текстов возвращает не только текст, но и координаты этого текста на изображении. Таким образом мы можем поместить переведенный текст в тот же bounding box.
После того как изображения готовы, также как и текст, сохраняем новую версию документации в формате pdf
Отдельного внимания проблема объема текста заслуживает в отношении изображений, так как в этом случае мы не могли просто адаптировать структуру документа. Для корректного вида изображений мы видоизменяли сам текст (включая шрифты, размер шрифтов и положение текста). Данный алгоритм позволил нам достичь хорошего качества, не меняя структуру изображений.
Уже на стадии тестового прототипа мы достигли впечатляющих результатов. Разработанный прототип был представлен заказчику, который отметил высокое качество перевода и сохранение структуры документации.
Стоимость перевода составила всего $0,03 за страницу, что делает решение экономически эффективным и освобождает для клиента большую часть бюджета, заложенную на перевод.