Распознавание документов на LLM

Система распознавания документов на LLM — 17 типов, 200+ реквизитов, без обучения

Автоматическое распознавание документов: загрузите файл — AI определит тип и извлечёт все ключевые реквизиты за секунды. Подключите по API к своей системе.

17+

типов документов

200+

извлекаемых реквизитов

22

формата файлов

Попробуйте прямо сейчас

Загрузите документ — AI определит тип и извлечёт реквизиты

📁

Перетащите файл сюда или нажмите для выбора

PDF, DOCX, XLSX, JPG, PNG и ещё 13 форматов. До 10 МБ.

Чем наша LLM-система отличается от классических OCR

Сравнение технологии распознавания на LLM с классическими OCR-движками

ПараметрAlial OCR (LLM)Классический OCR
(SmartEngines, ABBYY)
Понимает смысл и контекст документа
LLM анализирует содержание
распознаёт только символы
Работа «из коробки» без обучения шаблонов
17+ типов сразу
обучение под каждый шаблон
Извлечение смысловых полей, а не позиций
200+ реквизитов по смыслу
~по фиксированным зонам
Рукописный и нестандартный текст
да
~ограниченно
Нетиповые и новые формы документов
адаптируется
требует донастройки
Подключение по API без лицензий на места
self-serve, оплата по объёму
~лицензии и серверы

Поддерживаемые виды документов

AI автоматически определяет тип документа и подбирает схему извлечения реквизитов

📨

Входящее письмо

20 реквизитов

Дата, номер, контрагент, ИНН/КПП, адресат, подписант, тема

📝

Договор

11 реквизитов

Номер, дата, сумма, НДС, контрагент, подписанты, валюта

📎

Дополнительное соглашение

9 реквизитов

Номер, дата, основание, контрагент, ИНН/КПП

🧾

Счёт-фактура

14 + таблица реквизитов

Номер, дата, контрагент, ИНН/КПП, суммы, товары

🔄

Корр. счёт-фактура

12 реквизитов

Номер, дата, исходный СФ, контрагент, валюта

📋

УПД

18 + таблица реквизитов

Номер, дата, статус, контрагент, суммы, товары

📑

УКД

13 реквизитов

Номер, дата, исходный УПД, контрагент, статус

📦

ТОРГ-12

18 + таблица реквизитов

Номер, дата, контрагент, р/с, банк, суммы, товары

Акт выполненных работ

19 + таблица реквизитов

Номер, дата, основание, суммы, работы/услуги

💰

Счёт на оплату

19 + таблица реквизитов

Номер, дата, банковские реквизиты, товары

🚛

Транспортная накладная

9 реквизитов

Грузоотправитель, получатель, перевозчик, груз

📄

ТТН

11 реквизитов

Грузоотправитель, получатель, пункты погрузки/разгрузки

🪪

Паспорт РФ

12 реквизитов

ФИО, дата рождения, серия/номер, кем выдан

🏛️

Свидетельство ИНН

6 реквизитов

Наименование, ИНН, КПП, ОГРН, налоговый орган

💚

СНИЛС

7 реквизитов

Номер СНИЛС, ФИО, дата рождения, пол

🎖️

Военный билет

11 реквизитов

Серия/номер, ФИО, звание, часть, категория

🎓

Диплом об образовании

12 реквизитов

Серия/номер, ВУЗ, специальность, квалификация

Как это работает

От загрузки файла до готового JSON с реквизитами — 4 шага

📁
Шаг 01

Загрузка файла

PDF, DOCX, скан или фотография — просто перетащите файл

📄
Шаг 02

Извлечение текста

Для сканов и изображений автоматически применяется OCR через Vision-модель

🔍
Шаг 03

Классификация

LLM анализирует содержимое и определяет тип документа из 17+ категорий

📋
Шаг 04

Извлечение реквизитов

По схеме типа документа AI извлекает все ключевые поля и табличные данные

Распознавание в вашей 1С, SAP или ERP

Бухгалтер загружает скан → реквизиты автоматически попадают в учётную систему. Два способа подключения:

Работаете в 1С? Распознавание документов в 1С — внешняя обработка для Бухгалтерии, УТ и УНФ.
Нужно распознавать поток первички (накладные, акты, УПД)? Распознавание первичных документов — с интеграцией в учётную систему.

Самостоятельно по API

Зарегистрируйтесь на платформе, выпустите API-ключ и подключите распознавание к своей системе. Документы отправляются на эндпоинт /v1/ocr/process — в ответ структурированный JSON с реквизитами. Биллинг и аналитика — в кабинете.

Зарегистрироваться и получить ключ →

Внедрение под ключ

Наши специалисты внедрят распознавание в Directum RX, 1С и другие учётные системы под ваши процессы — от аудита до промышленной эксплуатации. Подходит для потока документов и сложных сценариев. Кейс: обработка первички

Безопасность данных

🔒

Шифрование

Передача данных по HTTPS, API-ключи хранятся только на сервере

🇷🇺

Серверы в России

Обработка на защищённых серверах MWS Cloud в РФ

🗑️

Без хранения

Файлы удаляются сразу после обработки, не сохраняются

Частые вопросы

Что такое система распознавания документов на LLM?+
Это система автоматического распознавания документов на базе больших языковых моделей (LLM), которая определяет тип документа (счёт-фактура, акт, договор и др.) и извлекает все ключевые реквизиты — номер, дату, контрагента, суммы, ИНН и другие поля. В отличие от классического OCR, LLM понимает смысл документа, а не только распознаёт символы.
Чем LLM-распознавание лучше классического OCR (ABBYY, SmartEngines)?+
Классический OCR распознаёт символы по фиксированным зонам и требует обучения шаблонов под каждую форму документа. LLM-система понимает контекст: извлекает смысловые поля, работает с рукописным текстом и нетиповыми формами, поддерживает 17+ типов «из коробки» без предварительной настройки и адаптируется к новым формам документов.
Какие типы документов поддерживаются?+
Более 17 типов: счёт-фактура, УПД, УКД, ТОРГ-12, акт выполненных работ, договор, допсоглашение, счёт на оплату, транспортная накладная, ТТН, входящее письмо, паспорт РФ, свидетельство ИНН, СНИЛС, военный билет, диплом об образовании и другие.
Насколько точно работает классификация?+
Средняя точность классификации — 90-95%. LLM-модель анализирует содержимое документа и определяет его тип по контексту, а не только по ключевым словам, поэтому корректно работает даже с нестандартными формами.
Какие форматы файлов можно загружать?+
Поддерживается 22 формата: PDF, DOC, DOCX, RTF, ODT, TXT, XLSX, ODS, CSV, JPG, PNG, TIFF, BMP, GIF, HTML, XML и другие. Для сканов и фотографий автоматически применяется OCR.
Какие реквизиты извлекаются?+
Более 200 реквизитов по всем типам документов: реквизиты компании (наименование, ИНН, КПП, ОГРН, банковские реквизиты), реквизиты документа (номер, дата, суммы, НДС, валюта, подписанты) и табличные данные (позиции товаров и услуг, количество, цены).
Как подключить распознавание к своей системе?+
Зарегистрируйтесь на платформе Alial API (api.alial.group), выпустите API-ключ в личном кабинете и отправляйте документы на эндпоинт /v1/ocr/process — в ответ приходит структурированный JSON с типом документа и реквизитами. В кабинете доступны биллинг и аналитика по запросам.
Можно ли интегрировать с 1С, SAP или другой ERP?+
Да, двумя способами: самостоятельно — через REST API платформы (ваши разработчики подключают распознавание к 1С/SAP/ERP), либо «под ключ» — наши специалисты внедряют распознавание в Directum RX, 1С и другие учётные системы под ваши процессы.
Сколько стоит?+
Регистрация и API-ключ — бесплатно, на старте доступна бесплатная квота для тестирования. Дальше — тарифы по объёму обработанных документов. Все расходы и аналитика видны в личном кабинете платформы.
Безопасно ли загружать документы?+
Да. Файлы обрабатываются на защищённых серверах в России (MWS Cloud), не сохраняются после обработки и удаляются сразу после извлечения реквизитов. Передача данных по HTTPS, API-ключи хранятся только на сервере.

Используете распознавание на потоке?

Посмотрите, как распознавание встроено в реальные процессы документооборота:

Подключите распознавание в свою систему

Зарегистрируйтесь на платформе Alial API, выпустите ключ и начните распознавать документы по API. Регистрация бесплатна, на старте — бесплатная квота.