MY MENU

새로운 소식

[ 제품 및 다윈컨설팅에 대한 새로운 소식을 전달합니다. ]

제목

시맨틱 웹(Semantic Web)

작성자
다윈컨설팅
작성일
2015.12.17
첨부파일0
조회수
1024
내용
◇웹의 3단계 발전과정

정적 구조→동적→지능형으로 진화중

얼마 전 신문, 잡지, 텔레비전 등 모든 매체에서 집중적으로 보도한 인터넷 대란 소식을 보면서 인터넷이 우리 생활에서 차지하는 비중이 대단하다는 것을 새삼 느꼈다. 90년대 초에 등장한 웹은 10여년 동안 양적, 질적으로 발전해 이제는 웹을 통해 물건을 사고, 음악이나 영화를 보며 영어 뿐만 아니라 대학 강의도 수강하게 됐다.

웹의 발전과정은 3세대로 나누어 설명할 수 있다. 1세대 웹은 웹의 등장에서부터 HTML(Hyper Text Markup Language)로 작성된 웹 페이지를 통한 정보 공유가 활성화된 시기이다. 이 세대의 웹 페이지 내용은 주로 웹 마스터에 상당히 의존적이며 변화가 적은 정적인 구조를 가진다.

2세대 웹은 멀티미디어 요소들이 결합돼 웹 페이지의 정보를 다양한 형태로 보여줄 뿐만 아니라 웹 마스터에 의존하기 보다는 데이터베이스(DB)에 저장된 데이터를 가공해 웹 페이지에 보여줌으로써 동적인 콘텐츠 구성이 가능해졌다.

3세대의 웹은 의미 기반의 정보 검색과 에이전트(agent)에 의한 자동화된 웹서비스가 가능한 지능형 웹인 시맨틱 웹(Semantic Web)으로 진화한다. 현재는 2세대 웹에서 점차 3세대 시맨틱 웹으로 발전해 가기 위해 주요 핵심기술들이 연구ㆍ개발되고 있다.

정보의 양이 기하급수적으로 증가하고 정보의 형태 또한 다양해지면서 사용자의 요구에 적합한 정보만을 효율적으로 추출, 가공해 제공하는 문제가 중요하게 됐다. 모 인터넷 검색 엔진 업체에서는 지식 검색이 가능한 검색 엔진이라는 광고 문구를 내세우고 있으며, 다른 여러 검색 엔진들에서도 유사한 형태의 지식 검색 서비스를 제공할 계획을 가지고 있다.

그러나 이들 지식 검색 서비스를 보면 토론 게시판에 단순히 검색 엔진을 붙여 놓은 것에 불과하다. 그럼에도 불구하고 검색 엔진 업체들이 왜 이런 서비스를 하려는 것일까?

사용자는 대부분 원하는 정보를 찾기 위해 가장 먼저 검색 엔진을 이용한다. 몇 개의 키워드들을 조합해서 입력하면 검색 엔진은 키워드들이 들어있는 많은 문서(웹 페이지)들을 찾아내 나름대로 순위를 매긴 다음 사용자에게 요약과 함께 문서 제목 및 주소(URL)를 보여준다.

사용자는 원하는 정보를 얻기 위해 검색 엔진이 수집해준 이들 리스트를 차례로 살펴보면서 필요한 경우 해당 주소로 이동한 다음 웹 페이지에 담겨 있는 내용을 직접 확인하는 과정을 반복함으로써 오랜 시간이 지난 후 원하는 정보를 얻게 된다. 물론 적합한 정보를 찾을 수 없는 경우도 빈번하다.

이런 지루하고 힘든 작업을 사용자 대신 검색 엔진이 할 수는 없을까? 단순한 자료의 수집 기능에서 벗어나 문서에 담겨 있는 내용의 의미를 파악하고 사용자의 질문에 적합한지 평가해서 적합한 결과만을 가려내 줄 수는 없을까? 이런 질문들에 해답을 구하려는 시도가 시맨틱 웹의 등장 배경이라고 볼 수 있다.

◇시맨틱 웹이란

사람대신 기계가 스스로 서비스 실행

시맨틱 웹은 웹 상에 존재하는 정보를 사람 뿐만 아니라 기계가 의미를 파악하고 사용자의 요구에 적합한 결과만을 찾아주는 의미 기반 검색이나 사람과 기계 또는 기계와 기계 상호간에 협업을 원활히 수행함으로써 사람을 대신한 자동적인 서비스가 가능하도록 하는 것이다.

시맨틱 웹을 구축하기 위한 첫 걸음은 HTML의 한계를 뛰어넘는 데서 시작한다. HTML을 사용하여 작성된 수많은 자료들은 사람이 읽고 그 의미를 파악하도록 되어 있다. 이는 HTML이 문서의 구조나 내용을 설명하는 것이 아니라 폰트, 크기, 레이아웃, 스타일 등 문서의 외양을 제어하는 태그들로 구성되어 있기 때문이다.

그러므로 HTML로 작성된 문서의 경우 기계가 그 문서에 들어있는 의미나 구조를 해석하는 것이 어렵다. HTML과 달리 XML(eXtensible Markup Language)은 문서의 구조를 정의하는 마크업 언어로 문서 생성자가 문서의 내용을 설명하는 태그를 임의로 생성할 수 있다. XML로 작성된 문서의 경우 기계가 그 문서에 들어 있는 내용의 구조를 파악할 수 있다.

W3C의 시맨틱 웹 관련 자료(www.w3.org/2001/12/semweb-fin/w3csw)에서 보여지는 시맨틱 웹의 구조를 살펴보면 XML을 기반으로 상위에 RDF, 온톨로지(Ontology), 로직(Logic), 트러스트(Trust) 등의 계층들이 있음을 알 수 있다. XML이 가지는 문제는 태그 자체의 의미를 부여할 수 없기 때문에 문서 내용과 무관한 태그를 사용할 수 있다는 것이다.

예를 들어 
디지털타임스
와 같이 태그명 자체에 대한 정의나 제약조건이 없기 때문에 내용과 부적합한 태그도 사용이 가능하다. 이러한 문제를 해결하기 위해 시맨틱 웹에서는 RDF(Resource Description Framework)를 사용하여 문서의 의미 정보와 문서간의 연관정보를 표현한다. RDF의 기본 구조는 주어, 동사, 목적어에 해당하는 세 개의 정보(Subject, Predicate, Object)를 한 쌍으로 가진다. 이를 문장(statement)이라 하고 사람이나 웹 문서 등 특정 대상이 특정 속성에 대해 특정 값을 가지는 것을 표현한다.

그러나 RDF와 RDFS(RDF Schema)만으로는 의미 정보를 표현하는데 부족한 부분이 있기 때문에 DAML+OIL(DARPA Agent Markup Language + Ontology Inference Layer)와 같이 제약조건과 로직을 표현하도록 확장된 언어를 이용하여 온톨로지(ontology)를 구축한다.

현재 시멘틱 웹의 핵심 기술들 중 활발한 연구가 수행되는 분야가 온톨로지 분야이다. 온톨로지는 개념들을 표준 용어로 정의하고 용어들간의 계층구조와 연관관계를 정의함으로써 지식을 표현하는 것이다. 시맨틱 웹에서는 지식 도메인별로 다수의 분산된 표준 온톨로지를 구축하고 이들간에 상호 참조에 의해 지식 기반 검색 및 서비스가 가능하도록 한다.

◇웹서비스란

웹기반SW시스템 자료 제공하는 서비스   
 
요즘 마이크로소프트, IBM, 썬마이크로시스템즈, HP 등 주요 메이저 IT 기업들의 최대 화두는 웹서비스이다. 웹서비스는 등장한지 3년 정도의 짧은 기간 동안 많은 표준들이 연구되고 개선되어 왔으며 관련 제품들도 상당수 개발되고 있다.

웹서비스는 간단히 말해서 웹을 기반으로 한 분산 컴퓨팅이라고 할 수 있다. 보다 정확히 말하면 인터넷 상에서 URI(Universal Resource Identifier)로 찾을 수 있는 소프트웨어 시스템으로서 서비스를 받고자 하는 다른 소프트웨어 시스템을 찾을 수 있도록 제공하는 서비스에 대한 설명을 XML로 작성하여 서비스 레지스트리에 등록한다.

예를 들어 마이크로소프트의 사용자 인증을 위한 패스포트 서비스가 일종의 웹서비스이다. MSN 메신저 등 여러 마이크로소프트 제품에서 사용자 인증을 위한 부분을 각 애플리케이션마다 따로 구현하는 것이 아니라 패스포트 서비스를 호출하여 인증 처리를 하게 된다.

웹서비스 구조를 설명하는 W3C의 자료(http://www.w3.org/TR/2002/WD-ws-arch-20021114/)를 보면 서비스 제공자(Service Provider), 서비스 요청자(Service Requestor), 서비스 대리자(Service Agency)로 나누어진다.

서비스 제공자는 웹서비스를 구현하여 서비스를 제공하는 소프트웨어 시스템이고 서비스 요청자는 서비스를 받기 위해 웹서비스를 호출하는 소프트웨어 시스템이다. 그리고 서비스 대리자는 웹서비스를 카테고리별로 분류하고 웹서비스의 내용을 저장함으로써 서비스 요청자가 자신이 필요한 웹서비스를 쉽게 찾을 수 있도록 디렉토리 서비스를 제공하는 레지스트리이다.

웹서비스와 관련된 표준으로 SOAP(Simple Object Access Protocol), WSDL(Web Service Description Language), UDDI(Universal Description, Discovery, and Integration Protocol)가 있다.

게시물수정

게시물 수정을 위해 비밀번호를 입력해주세요.

댓글삭제게시물삭제

게시물 삭제를 위해 비밀번호를 입력해주세요.