АВТОР
Даниил Акерман
ДАТА ПУБЛИКАЦИИ
13 января 2026 г.
КАТЕГОРИЯ
ML
ВРЕМЯ ЧТЕНИЯ
10 минут

Наша команда готова взяться за ваш проект. Оставьте заявку — мы свяжемся с вами и обсудим детали.
Похожие статьи
Все статьи
Телеграмм
Делимся визуально привлекательными фрагментами наших последних веб-проектов.
ВКонтакте
Пишем о интересных технических решениях и вызовах в разработке.
MAX
Демонстрируем дизайнерские элементы наших веб-проектов.
Создаем детальные презентации для наших проектов.
Рассылка
© 2025-2026 MYPL. Все права защищены.
Компания обрабатывает накладные вручную: опечатки, медленность, потери. Решение: OCR + AI для автоматического извлечения данных из накладных и загрузки в систему.
При обработке 500 накладных в день:
Перед автоматизацией важно подготовить документы. Накладные должны быть четкими, без размытия, с хорошим контрастом. Если документы старые или плохого качества, стоит их отсканировать заново с разрешением не менее 300 DPI.
Пример: Компания "Логистик Плюс" имела архив из 10 000 старых накладных. Они отсканировали их заново с разрешением 300 DPI, что повысило точность распознавания с 70% до 95%.
Для автоматизации накладных подходят разные OCR-решения:
EasyOCR (бесплатно): подходит для компаний с ограниченным бюджетом. Точность 85-90% на качественных документах. Работает локально, данные не уходят в облако.
AWS Textract ($1.50 за документ): лучший выбор для компаний, обрабатывающих много накладных с таблицами. Точность 92-95%, отлично работает с формами и структурированными данными.
Claude Vision ($2.00 за документ): если нужна не только распознавание текста, но и понимание контекста. Например, система может понять, что "Итого" означает сумму, даже если она написана в разных местах документа.
После распознавания текста нужна система, которая извлечет нужные данные. Это делается с помощью AI или правил.
Подход 1: Правила (если формат накладных стандартный)
Подход 2: AI (если формат накладных разный)
Пример: Компания "Торговый Дом" получает накладные от 50 разных поставщиков, каждый со своим форматом. Они использовали Claude Vision для извлечения данных, что дало точность 94% против 78% при использовании правил.
После извлечения данных система должна проверить их корректность:
Проверки:
Пример: Система обнаружила, что в накладной сумма товаров 100 000 рублей, а итоговая сумма 120 000 рублей. Система автоматически проверила НДС (20%) и подтвердила корректность: 100 000 × 1.2 = 120 000.
После валидации данные загружаются в систему учета (1С, SAP, или другую). Это делается через API или файловый импорт.
Вариант 1: API интеграция
Вариант 2: Файловый импорт
Симптомы: сумма 100 000 рублей распознается как "100 ООО рублей" или "100000 рублей" без пробелов.
Решение: используйте AWS Textract, который специально обучен на распознавание чисел и таблиц. Также добавьте постобработку: если система видит "ООО" в контексте чисел, заменяет на "000".
Пример: Компания "СтройМатериалы" имела проблему с распознаванием сумм. После перехода на AWS Textract и добавления постобработки точность выросла с 82% до 96%.
Симптомы: система хорошо работает с накладными от поставщика А, но плохо с накладными от поставщика Б.
Решение: создайте шаблоны для каждого поставщика. Система сначала определяет поставщика (по логотипу, тексту, формату), затем применяет соответствующий шаблон извлечения данных.
Пример: Компания "Розница Плюс" работает с 30 поставщиками. Они создали 30 шаблонов, что повысило точность извлечения данных с 75% до 91%.
Симптомы: на накладной есть рукописные пометки (например, "Срочно!" или подпись), которые мешают распознаванию.
Решение: используйте AI-модели, которые могут игнорировать рукописные пометки (Claude Vision или специально обученные модели). Также можно добавить предобработку: обрезка краев документа, где обычно находятся пометки.
Симптомы: система находит ошибки валидации и не загружает данные, требуя ручного вмешательства.
Решение: добавьте систему "мягкой валидации" — если ошибка не критична (например, дата в будущем на 1 день из-за разницы часовых поясов), система предупреждает, но все равно загружает данные. Критичные ошибки (сумма = 0) блокируют загрузку.
День 1-2: проанализируйте текущий процесс обработки накладных. Сколько накладных в день? Сколько времени на одну? Какие ошибки чаще всего?
День 3-4: соберите образцы накладных (минимум 50 штук) от разных поставщиков. Проверьте их качество: четкость, контраст, наличие таблиц.
День 5: выберите OCR-решение на основе бюджета и требований. Для начала можно использовать бесплатный EasyOCR для тестирования.
День 1-3: протестируйте выбранное OCR на ваших образцах накладных. Измерьте точность распознавания текста.
День 4-5: если точность низкая (<85%), попробуйте другое OCR-решение или улучшите качество исходных документов.
День 1-2: разработайте систему извлечения данных. Если форматы стандартные — используйте правила. Если разные — используйте AI.
День 3-4: разработайте систему валидации данных. Определите, какие проверки критичны, какие нет.
День 5: протестируйте систему на образцах накладных. Измерьте точность извлечения данных.
День 1-2: интегрируйте систему с вашей системой учета (1С или другой).
День 3-5: запустите пилот на реальных накладных (50-100 штук). Сравните результаты автоматической обработки с ручной. Исправьте найденные проблемы.
День 1-2: разверните систему для всех накладных. Начните с небольшого объема (например, 20% накладных), постепенно увеличивайте.
День 3-5: мониторьте работу системы, собирайте обратную связь от сотрудников, исправляйте проблемы.
Проблема: компания обрабатывала 200 накладных в день вручную. Ошибки составляли 8%, время обработки — 12 минут на накладную.
Решение: внедрили AWS Textract + систему извлечения данных на Python. Интеграция с 1С через API.
Результаты:
Проблема: сеть из 50 магазинов получала накладные от 100 поставщиков. Каждый магазин обрабатывал накладные отдельно, формат накладных разный.
Решение: централизованная система на базе Claude Vision. Система определяет поставщика и применяет соответствующий шаблон извлечения данных.
Результаты:
Проблема: водители привозили накладные в офис, где их вводили вручную. Это создавало задержки и ошибки.
Решение: мобильное приложение для водителей. Водитель фотографирует накладную, система распознает и загружает данные в систему логистики в реальном времени.
Результаты:
Вопрос 1: Сколько стоит внедрение автоматизации накладных?
Зависит от выбранного OCR и объема работ. Бесплатный OCR (EasyOCR) + разработка: 50-100 тыс рублей. Облачный OCR (AWS Textract) + разработка: 80-150 тыс рублей + 100-300 тыс рублей/год на API. Premium OCR (Claude Vision) + разработка: 100-200 тыс рублей + 200-500 тыс рублей/год на API.
Вопрос 2: Как долго длится внедрение?
Обычно 3-5 недель: 1 неделя на подготовку и тестирование OCR, 1-2 недели на разработку системы извлечения данных, 1 неделя на интеграцию и пилот, 1 неделя на запуск.
Вопрос 3: Нужно ли переобучать систему, если формат накладных изменится?
Если вы используете AI-подход (Claude Vision), система адаптируется автоматически. Если используете правила, нужно обновить правила при изменении формата. Обычно это занимает 1-2 дня.
Вопрос 4: Что делать, если OCR неправильно распознает документ?
Во-первых, проверьте качество исходного документа (четкость, контраст). Во-вторых, попробуйте другое OCR-решение. В-третьих, добавьте постобработку для исправления типичных ошибок. В-четвертых, система должна отправлять проблемные документы на ручную проверку.
Вопрос 5: Можно ли автоматизировать обработку старых накладных из архива?
Да, но точность будет ниже, если документы плохого качества. Рекомендуется сначала отсканировать их заново с высоким разрешением (300 DPI). Также можно использовать более мощные OCR (AWS Textract или Claude Vision) для старых документов.
Вопрос 6: Безопасно ли отправлять накладные в облачные OCR?
Если накладные содержат конфиденциальную информацию (например, персональные данные клиентов), лучше использовать локальные OCR (Tesseract или EasyOCR). Если информация не критична, облачные OCR безопасны при соблюдении правил безопасности (шифрование, ограничение доступа).
Вопрос 7: Как измерить успех внедрения?
Ключевые метрики: время обработки одной накладной (должно снизиться на 80-90%), процент ошибок (должен снизиться на 80-90%), экономия времени в часах/рублях, удовлетворенность сотрудников.
Автоматизация обработки накладных — это не роскошь, а необходимость для компаний, которые обрабатывают много документов. Современные OCR-технологии позволяют снизить ошибки на 99% и ускорить работу в 10-15 раз. ROI обычно составляет 1-3 месяца, что делает это инвестицией с быстрой окупаемостью.
Начните с бесплатного OCR (EasyOCR) для тестирования, покажите результаты руководству, затем масштабируйте на платные решения для максимальной точности.