DOOSAN Digital Innovation

인사이트 콘텐츠

  1. Home
  2. 리소스
  3. 인사이트 콘텐츠

[Case Study] 동원그룹 | 생성형 AI로 비정형 문서 처리의 한계를 넘어선 AI OCR 혁신

AI 2026.06.18

동원그룹

🚀 빠르게 살펴보는 요점

동원그룹의 다양한 인보이스와 비정형 문서를 처리하기 위한 생성형 AI 기반 OCR 시스템 구축

기존 OCR로 처리하기 어려웠던 신규 양식과 비정형 문서까지 유연하게 대응

문서 업로드 후 AI가 핵심 항목과 표 데이터를 자동으로 인식·추출, 결과 검토 프로세스 구현

㈜두산 디지털이노베이션BU(이하 DDI)는 Gen AI 인프라 구성, 프롬프트 설계, AI 문서 인식 로직, 데이터 추출 및 검증 로직 등 핵심 AI OCR기능 고도화

운영 환경을 고려한 LLM 모델 성능 비교, Gen AI 추출 모듈 개발, SSO 연동, 코드 체계 확장 등 수행

문서 처리 확장성을 높이고, 반복적인 데이터 확인·입력 업무의 효율성을 개선할 수 있는 기반 마련

Company

동원그룹은 수산업을 기반으로 성장해 온 종합식품기업으로, 글로벌 수산 자원 개발과 식품 생산, 유통 전반에 걸쳐 높은 경쟁력을 보유하고 있습니다. 오랜 경험과 축적된 기술력을 바탕으로 고품질의 수산식품과 식품 원료를 안정적으로 공급하며, 지속 가능한 해양 자원 활용과 식품 산업의 혁신을 통해 고객의 건강하고 풍요로운 식생활에 기여하고 있습니다.

Challenge - 고객사가 당면한 과제

동원그룹은 기존 OCR 방식만으로는 다양한 문서 양식과 비정형 데이터 처리에 한계가 있었습니다.

  • 비정형 문서 처리의 필요성

    템플릿이 정의되지 않은 비정형 문서나 신규 인보이스에는 유연하게 대응하고자 했습니다.

  • 신규 양식 추가 시 운영 부담

    새로운 문서 양식이 생길 때마다 별도 설정이나 개발 작업이 필요하면 운영 부서의 부담이 커집니다.
    따라서 관리자가 자주 사용하는 양식을 직접 등록하고, 사용자가 개별 문서에 맞춰 추출 항목을 설정할 수 있는 구조를 만들고자 했습니다.

  • 수작업 검토 및 데이터 재입력 부담

    사람이 직접 확인하고 엑셀 등으로 옮기는 방식은 시간이 많이 소요되고 오류 가능성도 존재합니다.
    특히 문서 내 키워드, 표 데이터, 여러 페이지 또는 여러 파일을 다루는 경우에도 자동화 수준을 높이고자 했습니다.

  • 정확도 개선과 운영 관리 필요

    AI OCR은 단순 추출에서 끝나는 것이 아니라, 결과에 대한 피드백을 축적하고 향후 정확도 개선에 활용할 수 있어야 합니다.
    피드백 입력 기능을 구현해 향후 정확도 향상 자료로 활용하고자 했습니다.

Solution – 해결 방안 및 DDI의 역할

DDI는 생성형 AI와 OCR을 결합해, 문서 유형 확장·항목 추천·데이터 추출·결과 검토·엑셀 다운로드까지 이어지는 AI OCR 업무 프로세스를 구현했습니다.

[AWS 주요 서비스 기반의 데이터 처리 구조]

  • AWS 주요 서비스 기반의 GPT OCR 처리 구조 적용

    • Amazon API Gateway: OCR Web과 AI OCR 분석 기능을 연결하는 API 호출 채널 역할

    • AWS Lambda: 문서 업로드 이후 OCR 분석 요청, 데이터 처리, AI OCR 추출 프로세스 실행

    • Amazon S3: 업로드된 문서 파일과 AI OCR 처리 대상 데이터를 저장하는 스토리지

    • Amazon RDS: 사용자 정보, 템플릿 정보, OCR 분석 결과 등 운영 데이터를 관리하는 DB

    • Amazon Bedrock: Claude 4 Model 기반의 생성형 AI 문서 분석 및 GPT OCR 추출

    • Amazon SES: 시스템 알림 및 메일 발송 연계 기반 서비스로 활용

    • Amazon EC2 / ELB: OCR Web 서비스 운영 환경과 외부 접속 처리를 위한 인프라 역할

  • 기존 OCR 시스템과 생성형 AI 기반 GPT OCR 구조 통합

  • 하이브리드 클라우드 연계 구조 설계

  • SSO 및 사용자 인증 체계 적용

  • 템플릿 기반 AI OCR 관리 기능 구현

  • 프롬프트 기반 추출 항목 설정 체계 적용

  • AI 추천 기반 추출 항목 자동화

  • PDF 파일 업로드 기반 GPT OCR 등록 프로세스 구현

  • 신뢰도 기반 추출 결과 검토 화면 설계

  • 피드백 기반 AI OCR 품질 개선 체계 마련

  • 관리자 통계 및 운영 모니터링 기능 구현

  • 사용자 화면 커스텀 및 업무 활용성 강화

DDI는 기존 OCR 환경을 유지하면서 AWS 기반 AI OCR 처리 구조와 Amazon Bedrock 기반 생성형 AI 분석 기능을 결합했습니다. 이를 통해 동원산업은 비정형 문서와 다양한 인보이스를 템플릿·프롬프트 기반으로 관리하고, AI 추천·신뢰도 검토·피드백 관리까지 포함한 확장형 GPT OCR 업무 프로세스를 구현할 수 있게 되었습니다.

Benefit – 성과 및 효과

동원그룹은 생성형 AI 기반 OCR 시스템을 통해 문서 처리 범위를 넓히고, 신규 양식 대응 속도와 업무 효율성을 높일 수 있게 되었습니다.

  • 비정형 문서 처리 확대

    템플릿이 미리 정의되지 않은 문서도 손쉽게 처리할 수 있는 기반을 마련했습니다.

  • 신규 문서 양식 대응력 강화

    새로운 문서 양식이 추가되어도 관리자가 템플릿을 등록하거나 사용자가 추출 항목을 설정해 빠르게 대응할 수 있습니다. 이는 신규 양식 추가 시 별도 개발 의존도를 낮추고, 업무 부서 중심의 유연한 문서 자동화를 가능하게 합니다.

  • 사용자 경험 변화 최소화

    기존 사용자가 익숙한 UI/UX 흐름에서 AI OCR 기능을 활용할 수 있도록 설계되어 변화 관리 부담을 줄였습니다.

  • 데이터 추출 업무 효율화

    문서 업로드 후 AI가 주요 항목과 표 데이터를 추출하고, 사용자는 결과를 확인한 뒤 엑셀로 다운로드할 수 있습니다. 이를 통해 반복적인 문서 확인, 데이터 입력, 엑셀 정리 업무를 줄이고 더 중요한 검토·분석 업무에 집중할 수 있습니다.

  • AI 정확도 개선 기반 확보

    추출 결과에 대한 사용자 피드백을 입력하고, 이를 향후 정확도 향상 자료로 활용할 수 있도록 했습니다. 이는 AI OCR 시스템이 단발성 자동화 도구가 아니라, 운영 데이터와 피드백을 기반으로 지속적으로 개선될 수 있는 구조임을 보여줍니다.

  • 생성형 AI 운영 관리 역량 확보

    사용자별 사용량, 회사별 토큰 사용량, LLM 호출 비용 등을 관리할 수 있어 AI 활용 현황과 비용을 투명하게 파악할 수 있습니다. 이는 기업 환경에서 생성형 AI를 안정적으로 운영하기 위한 중요한 관리 체계입니다.