DOOSAN Digital Innovation

인사이트 콘텐츠

  1. Home
  2. 리소스
  3. 인사이트 콘텐츠

[Case Study] 컴포인 | AI OCR과 데이터 비교 로직으로 성적서·계약서 검증 업무 지능화

AI 2026.06.23

컴포인 로고

🚀 빠르게 살펴보는 요점

성적서·계약서 중심의 문서 검증 자동화 사례

기존 On-prem 저장소와 연계되는 AI OCR 구조

기준 데이터 추출 및 데이터 비교 로직 구현

AWS 기반 클라우드 네이티브 아키텍처 적용

RAG 기반 문서 지식 검색으로 활용 범위 확장

처리 시간 단축과 정확도 향상 성과 확보

Company

컴포인은 SI, IT, 솔루션 전문기업으로, 국내 IT 분야 전문가들이 설립한 회사입니다. 대기업에서 축적한 업무 지식과 벤처 전문가들의 다양한 경험을 바탕으로, 고객사의 IT 인프라 구축, 시스템 운영, 솔루션 제공, 아웃소싱 서비스를 지원하는 기업입니다.

Challenge - 고객사가 당면한 과제

컴포인은 성적서와 계약서처럼 정확한 값 확인이 중요한 문서 업무에서, 수작업 입력과 검증 부담을 줄이고 기존 저장소와 연계 가능한 AI OCR 체계를 필요로 했습니다.

  • 성적서·계약서 중심의 문서 검증 부담

    컴포인의 주요 업무 흐름에는 성적서 업로드와 계약서 관리가 포함되어 있습니다.
    이러한 문서는 단순 텍스트 추출보다, 문서 내 값이 기준 데이터와 맞는지 확인하는 검증 과정이 중요합니다.

  • 기존 On-prem 저장소와의 연계 필요

    컴포인은 On-prem DC 및 DB/File 환경을 보유하고 있어, 신규 AI OCR 시스템이 기존 저장소와 단절되지 않아야 했습니다.
    문서 업로드 후 추출된 데이터를 기존 기준 데이터와 연결하고, 업무 시스템에서 활용할 수 있는 구조가 필요했습니다.

  • 기준 데이터 추출 및 비교 로직 구현 필요

    프로젝트 수행 내역에는 기준 데이터 추출과 데이터 비교 로직 구현이 포함되어 있습니다.
    이는 컴포인 사례가 단순 OCR 자동화가 아니라, AI가 추출한 데이터와 업무 기준을 비교해 검증 업무를 지원하는 방향으로 추진되었음을 보여줍니다.

  • 추출 정확도 개선과 안정화 요구

    중간보고서에는 추출 로직 정확도 개선, 기술 협의, 안정화, 향후 계획 수립이 주요 수행 흐름으로 제시되어 있습니다.
    문서 처리 자동화가 실제 업무에 적용되기 위해서는 AI 추출 결과의 정확도와 운영 안정성이 함께 확보되어야 했습니다.

  • 문서 데이터의 장기 활용 기반 필요

    프로젝트 화면 구조에는 문서 지식 검색(RAG) 영역이 포함되어 있으며, 문서등록, 유사 문서 검색, 등록 이력, 지식 데이터 관리 기능이 설계되었습니다.

Solution – 해결 방안 및 DDI의 역할

DDI는 컴포인의 성적서·계약서 업무에 맞춰 AI OCR, 기준 데이터 비교, 저장소 연동, RAG 기반 검색을 결합한 문서 검증형 AI 플랫폼을 설계했습니다.

[AWS 주요 서비스 기반의 데이터 처리 구조]

AWS 주요 서비스 기반의 데이터 처리 구조
  • 성적서·계약서 업무에 맞춘 AI OCR 처리 구조 설계

    컴포인의 기존 업무 흐름인 성적서 업로드, 계약서 관리, On-prem DB/File 환경을 고려해 AI OCR 플랫폼을 설계했습니다.
    문서 업로드 이후 AI가 핵심 데이터를 추출하고, 추출 결과를 업무 기준 데이터와 연계할 수 있는 구조를 마련했습니다.

  • 기준 데이터 추출 및 데이터 비교 로직 구현

    DDI는 프로젝트 수행 과정에서 기준 데이터 추출과 데이터 비교 로직 구현을 수행했습니다.
    이를 통해 AI OCR 결과가 단순 텍스트로 저장되는 것이 아니라, 기존 기준값과 비교·검증 가능한 업무 데이터로 전환될 수 있도록 했습니다.

  • 저장소 연동을 통한 기존 업무 시스템 활용성 강화

    주요 수행 내역에 저장소 연동이 포함되어 있어, 기존 DB/File 기반 환경과 AI OCR 결과를 연결하는 방향으로 프로젝트가 진행되었습니다.
    이는 신규 AI 시스템을 별도 도구로 분리하지 않고, 기존 문서 관리 흐름 안에서 활용할 수 있도록 하기 위한 핵심 요소입니다.

  • Gen AI 기반 추출 모듈 및 LLM 성능 비교

    DDI는 As-Is 솔루션 환경을 분석하고, LLM 모델 성능을 비교한 뒤 Gen AI 추출 모듈을 개발했습니다.
    AI는 문서 내 문맥을 이해하고, 성적서·계약서에서 필요한 주요 데이터를 추출하는 역할을 수행합니다.

  • AWS 주요 서비스 기반의 AI 문서 처리 체계 구성

    • Amazon S3: 업로드 문서와 분석 대상 파일 저장

    • AWS RDS PostgreSQL 16 Multi-AZ: 사용자, 템플릿, 분석 결과 등 주요 운영 데이터 관리

    • Amazon Bedrock Claude Model: 생성형 AI 기반 문서 분석 및 데이터 추출

    • AWS Bedrock Guardrails: AI 활용 과정의 안전성과 통제 수준 강화

    • S3 Vectors: 문서 지식 검색(RAG)을 위한 벡터 기반 검색 구조 지원

    • Amazon SES: 알림 및 메일 발송 연계 기반 제공

  • 문서 지식 검색(RAG) 기반 확장

    시스템 메뉴에는 문서 지식 검색(RAG) 기능이 포함되며, 하위 기능으로 문서등록, 유사 문서 검색, 등록 이력, 지식 데이터 관리가 구성되었습니다.
    이를 통해 성적서·계약서 데이터를 단순 보관하는 수준을 넘어, 향후 유사 문서 탐색과 문서 기반 지식 활용으로 확장할 수 있도록 했습니다.

  • 후처리 스크립트 기반 업무 규칙 반영

    템플릿 관리 영역에는 템플릿과 후처리 스크립트가 포함되어 있습니다.
    이는 AI가 추출한 데이터를 업무 기준에 맞게 정리하거나, 비교 로직·검증 규칙을 적용하는 데 활용될 수 있는 구조입니다.

  • AI 채팅과 운영 관리 기능 포함

    주요 메뉴에는 대시보드, AI 채팅, 문서 분석(OCR), 템플릿 관리, 문서 지식 검색(RAG), 관리 기능이 포함되었습니다.
    관리 영역에는 사용자 관리, 사용량·비용, 피드백 관리, 조직 관리, 감사 로그, 환경설정이 포함되어 기업 환경에서 AI OCR을 안정적으로 운영할 수 있도록 했습니다.

Benefit – 성과 및 효과

컴포인은 AI OCR 도입을 통해 문서 처리 자동화뿐 아니라, 성적서·계약서 데이터의 검증과 지식 활용까지 가능한 업무 기반을 확보했습니다.

  • 성적서·계약서 검증 업무 효율화

    문서에서 필요한 데이터를 AI가 추출하고, 기준 데이터와 비교할 수 있는 로직을 구현함으로써 검증 업무의 자동화 수준을 높였습니다.
    특히 기준 데이터 추출과 데이터 비교 로직 구현은 컴포인 사례의 핵심 차별점입니다.

  • 기존 저장소와 연결되는 AI OCR 활용 기반 확보

    On-prem DB/File 환경과 저장소 연동을 고려해, 기존 업무 시스템과 AI OCR 결과가 연결될 수 있는 구조를 마련했습니다.
    이를 통해 신규 시스템 도입에 따른 업무 단절을 줄이고, 기존 문서 관리 흐름을 확장할 수 있습니다.

  • 수작업 입력 및 검수 부담 감소

    AI가 문서의 핵심 데이터를 추출하고, 후처리·비교 로직을 통해 검증 과정을 지원함으로써 단순 입력과 반복 확인 업무를 줄일 수 있습니다.
    담당자는 문서 값을 일일이 옮기는 업무보다 예외 검토와 데이터 품질 관리에 더 집중할 수 있습니다.

  • 문서 데이터의 지식 자산화

    RAG 기반 문서 지식 검색을 통해 문서등록, 유사 문서 검색, 등록 이력, 지식 데이터 관리가 가능하도록 설계되었습니다.
    성적서와 계약서 데이터를 장기적으로 검색·활용 가능한 지식 자산으로 전환할 수 있는 기반을 마련했습니다.

  • 클라우드 네이티브 기반 확장성 확보

    ECS Fargate, AWS ALB, Amazon S3, RDS PostgreSQL Multi-AZ, Amazon Bedrock, S3 Vectors 등을 활용해 향후 문서 처리량 증가와 AI 기능 확장에 대응할 수 있는 구조를 마련했습니다.

  • AI 운영 통제 및 관리 체계 강화

    Bedrock Guardrails, 사용량·비용 관리, 피드백 관리, 감사 로그, 조직 관리 기능을 통해 AI 시스템 운영에 필요한 통제성과 추적성을 확보했습니다.