서브 헤더

Big Data · AI 구축

빅데이터를 비즈니스적으로 활용하기 위해 고객의 요구사항을 파악하고 빅데이터 분석을 통해 기존의 데이터에서 새로운 가치를 찾아내어 활용하도록 지원하는 서비스입니다. 아울러 AI 데이터의 품질을 확보하는 데 필요한 조직, 절차, 품질관리방법 및 활동 등을 포함하는 AI 데이터 품질관리체계를 제공합니다.

빅데이터 분석 방법론

단계설명
빅데이터 분석계획고객의 요구사항을 파악하고 빅데이터 분석을 위한 계획을 수립
빅데이터 분석준비데이터 분석에 필요한 원천 데이터를 정의하고 데이터 분석 환경을 구축
빅데이터 분석다양한 분석기법을 통해 빅데이터를 분석 수행
분석 결과 도출분석 결과를 도출하고 이를 시스템에 적용하거나 테스트 모델을 구현하여 검증
결과 분석적용 또는 테스트 모델의 성과를 평가하고 분석해 차기 발전 계획을 수립

빅데이터 분석 방법

아키텍처 요건 분석전통적인 분석 방법으로 주로 수치형 데이터에 대하여 확률을 기반으로 현상의 추정, 예측을 검증하는 기법
데이터 마이닝대용량 데이터로부터 패턴인식, 인공지능 기법 등을 이용하여 숨겨져 있는 데이터간의 상호관련성 및 유용한 정보를 추출하는 기술
텍스트 마이닝텍스트 기반의 데이터로부터 새로운 정보를 발견할 수 있도록 정보 검색, 추출, 체계화, 분석을 모두 포함하는 Text-processing 기술 및 처리 과정
소셜 네트워크 분석소셜 네트워크 상에서 언어분석 기반 정보를 추출하여 유통되는 이슈를 모니터링하고 향후 추이를 분석
평판 분석
(Sentiment Analysis)
소셜미디어 등의 정형/비정형 텍스트의 긍정(Positive), 부정(Negative), 중립(Neutral)의 선호도를 판별하는 기술
군집 분석
(Cluster Analysis)
비슷한 특성을 가진 개체를 합치면서 최종적으로 유사 특성의 군(Group)을 발굴하는 데 사용하는 기술
절차
준비성 인공지능 학습용 데이터 품질관리를 위해 기본적으로 관리해야 하는 정책, 규정, 조직 절차 등을 마련하고, 최신의 내용으로 충실하게 관리되는지를 검사하는 지표
완전성 인공지능 학습용 데이터를 구축함에 있어 물리적인 구조를 갖추고, 정의한 데이터 형식 및 입력값 범위에 맞게 데이터가 저장되도록 설계·구축되었는지를 검사하는 지표
유용성 발주기관(수요자)의 요구사항이 충분히 반영되었는지, 업무목적에 적합한 인공지능 학습용 데이터의 범위와 상세화 정도를 충족시키는지를 검사하는 지표
적합성 학습용도 적합성을 측정하는 지표로 다양성, 신뢰성, 충분성, 사실성을 측정하는 기술적 합성 지표와 클래스 분포도, 인스턴스 분포도, 문장길이, 어휘 개수 등을 측정하는 통계적 다양성 지표로 나눔
데이터
정확성 라벨링 정확성을 측정하는 지표로 정확도, 정밀도, 재현율을 측정하는 의미 정확성 지표와 어노테이션 데이터 일관성, 범위의 일치성을 측정하는 구문 정확성 지표로 나눔
유효성 학습용 데이터를 훈련시키기에 적합한 인공지능 알고리즘의 유효성을 측정하는 지표