MY MENU

새로운 소식

[ 제품 및 다윈컨설팅에 대한 새로운 소식을 전달합니다. ]

제목

`인텔리전트웹(Intelligent Web)`

작성자
다윈컨설팅
작성일
2015.12.17
첨부파일0
조회수
973
내용
2003년 8월은 컴퓨터 보안 역사상 최악의 달로 꼽힌다. 한 핀란드 회사에 의해 처음 모습을 드러낸 블래스터 웜은 8일 뒤 출현한 소빅 웜에 의해 그 심각성이 상쇄됐지만 여전히 관심의 대상이다. 이는 블래스터 웜이 매우 빠른 속도로 퍼져 나갔다는 점과 전혀 예측할 수 없는 변종이 생겼다는 점 때문이다.

변종의 하나인 블래스터B 배포자 웹사이트에서 오리지널 소스코드(source codes)를 볼 수 있어 손쉽게 소스 수정이 가해질 수 있었다는 사실은 그 위험성을 반증하고 있다. 실제 MS블래스터의 오리지널 배포자조차 이미 확산된 웜의 컨트롤 능력을 상실한 것으로 알려져, 이 웜의 오리지널 배포자에 대한 역추적은 더욱 어려워 질 것 같다. 그렇지만 이러한 웜을 잘 컨트롤하게 되면 매우 효과적인 일을 할 수 있다. 사실 웜은 미국 코넬 대학의 한 대학원생이 `자기복제' 실험을 하는 와중에서의 나온 것이다.

월드 와이드 웹(World Wide Web)은 네트워크를 통해 연결된 데이터라는 측면에서 보면 광범위한 범용성의 대가로 엄격함을 잃었다. 이는 웹의 최초 고안자인 영국 옥스포드 대학 출신 팀 버너스리(Tim Berners―Lee)의 디자인 철학이기도 하다.

이러한 디자인 철학이 우리에게 끼친 영향은 실로 막대하다. 단 하나의 단어만 가지고서도 평생을 공부 할 수 있을 만큼 많은 연관자료들을 웹에서 볼 수 있으며, 실제 구글(google)과 같은 검색엔진에서는 몇몇 단어의 조합으로 엄청난 양의 문서를 볼 수 있. 하지만 이는 웹의 단점을 드러낸 것이기도 하다. 검색된 문서 중에는 상당한 양의 의도되지 않은 문서도 있으며, 이러한 노이즈(noise)를 제거하기 위해서는 일일이 읽고 확인을 하는 것은 거의 불가능하다고 할 수 있다.

현재 라이코스나 구글 등 검색엔진은 넓은 의미에서 일종의 웜을 이용하고 있다고 봐도 큰 무리가 없다. 다만 여기서 이용되는 웜은 매우 잘 컨트롤되고 있어, 네트워크의 병목현상과 같은 부작용이 없다. 이는 인텔리전트 에이전트 소프트웨어 (Intelligent Agent Software) 라고 불리고 있으며, 웜과는 달리 매우 세심하게 조작된다.

이러한 에이전트가 블래스터 웜과 같은 속도로 전 세계에 걸쳐 있는 모든 웹서버의 문서를 파싱(Parsing) 할 수 있다면, 짧은 시간에 에이전트가 읽어낸 자료를 목적에 맞게 활용할 수 있게된다.

문제는 이러한 능력에도 불구하고, 웹으로는 개개의 자료가 어떤 의미를 띄고 있는지 파악하기 어렵다는 점이다. 캐싱(caching)이나 스레딩(threading), 혹은 데이터베이스관리시스템(DBMS)을 이용하는 에이전트는 네트워크를 통해서 아주 빠른 속도로 막대한 양의 정보를 열람할 수는 있지만, 그것이 어떤 의미를 갖고 있는지는 알 수 없다는 얘기다. 따라서 문서 등을 포함하는 각종 데이터를 네트워크를 통해 나열하고 방대한 양의 나열된 자료를 효과적으로 이용하기 위해서는, 나열된 자료에 꼬리표를 붙여 줌으로써 에이전트가 그 의미를 파악할 수 있도록 해주는 일을 할 필요가 있다.

이렇게 각 네트워크를 통해 나열된 자료에 꼬리표를 다는 일이 오늘의 주제인 인텔리전트 웹이다. 보통 XML(eXtensible Markup Language)이라는 언어로 의미를 부여하게 되는데, 의미가 부여된 네트워크 자료의 웹은 각 꼬리표 사이의 관계를 규정해 주는 온톨로지라는 테크놀러지를 이용해 규정된 의미간 연관관계를 설정할 수 있게 되며, 이를 바탕으로 에이전트는 `추론'을 할 수 있게돼 매우 지능적으로 사용된다. 이렇게 웹 상에서의 모든 객체에 의미가 부여된 상태를 말 그대로 시만틱웹(Semantic Web)이라고 부른다.

시만틱 웹은 인텔리전트 에이전트 소프트웨어 등과 같은 매우 위력적인 소프트웨어를 통해 이용되며, 이같은 차세대 웹을 통틀어 인텔리전트 웹 (Intelligent Web)이라고 부르고 있다.

에이전트 소프트웨어와 시만틱 웹 등을 모두 포함하는 인텔리전트 웹이 현재 급부상하고 있는 유비쿼터스 컴퓨팅과 같은 패러다임과 접목되면, 일반 가전제품을 통해서도 `추론'을 통해 `지능'을 가진 객체와 상호작용을 할 수 있게 될 것이다. 가령, 전자레인지의 특정식품 조리 온도를 알맞게 유지하는 것이 가능하다. 에이전트는 내가 정의하는 특정식품의 맛있는 조리 온도를 추론을 통해 알 수 있기 때문이다.

시만틱 웹은 웹 상에서의 그림, 문서 등의 모든 객체를 대상으로 에이전트라는 소프트웨어를 이용해 목적에 맞는 정보를 수집ㆍ가공ㆍ응용하려는 시도다. 이를 위해서는 일단 인간 뿐 아니라 에이전트 소프트웨어가 이해할 수 있는 언어로 웹상의 객체를 표현하는 작업이 필요하며, 이를 근거로 의미를 유추하여 객체간 관계를 설정하게 된다.

블래스터 사례에서 볼 수 있듯 에이전트 소프트웨어는 네트워크 상에서 매우 위력적일 수 있긴 하지만, 이러한 에이전트 소프트웨어가 훑고 지나가는 다양한 형태의 네트워크 상의 객체가 어떤 의미를 지니고 있는지 알고 있지는 않다. 즉 에이전트 소프트웨어가 네트워크 상에서의 데이터를 빠르게 수집하고 가공하게끔 하기 위해서는, 이 소프트웨어가 이해할 수 있는 네트워크를 만들어 주는 작업이 필요하며, 인텔리전트 웹에서는 이를 메타 데이터를 통해 해결하려는 시도를 하고 있다.

시만틱 웹에서는 웹 상에서의 모든 객체(혹은 웹에서 나열할 수 없는 객체)의 의미와 객체 사이의 관계를 서술하는 것이 필요하다. 객체의 의미와 객체 사이의 관계를 서술함에 있어 표준적인 방식이 적용된다면, 이를 이용하는 소프트웨어의 개발은 한층 효과적일 것이다. 최종적으로는 객체의 의미와 관계설정에 대한 신뢰를 확보하기 위한 장치가 필요하며, XML을 그 핵심 메커니즘으로 이용하게 될 것이다.

결국 XML이라는 태그 정의가 가능한 메커니즘을 이용하여 웹에 있는 모든 객체에 대한 데이터, 즉 메타 데이터를 작성하고 이러한 메타 데이터간의 불일치, 용어 분류, 메타 데이터간 관계를 온톨로지 레이어에서 엮어 주는 것이 골자이다. 90년대 후반에 들어 이러한 메타 데이터 정의와 그 관계의 신뢰도에 대한 중요성이 부각되기 시작하면서, 시만틱 웹의 가장 상위 레이어에서는 이러한 메타 데이터 신뢰성을 확보 할 수 있는 역할을 할 수 있는 레이어가 추가되었다.

시만틱 웹의 정의는 W3C의 `FAQ (What Semantic Web is Not)' 에서 좀 더 명확히 설명되고 있는 바, 시만틱 웹은 인공지능과는 동떨어진 분야임을 W3C의 관련문서에서 명백히 하고 있다.

유명한 가트너조차 소프트웨어 시장에서 상용 인텔리전트 소프트웨어가 얼마만한 비중을 차지하는가에 대한 쓸만한 통계자료가 이 시점에서는 없다고 보여진다. 즉 시만틱 웹이라는 인프라가 없는 상황에서 에이전트 SW가 `인텔리전트' 할 수 있는 여지는 그다지 크지 않은 것으로 보여진다.

지능과 구조 (Intelligence & Structure)는 매우 밀접한 상관관계를 갖고 있고, 많은 경우 뗄 수 없는 관계라는 것이 적어도 웹에서는 XML Topic Map(XTM)등의 표준을 통해 드러나고 있다. 구조적이지 않은 지능(Un-structured Intelligence)이라는 것은 사실 컴퓨터에서는 있을 수 없는 일일지 모른다.

이렇게 지능을 갖게 하는 구조의 가장 하부를 월드와이드웹에서는 RDF가 맡게 될 것이다. 이러한 구조가 어떤 과정을 거쳐 `지능'으로 표현되고 이용될 수 있는지는 현재 다소 모호한 상태이다. 그러한 과정의 메커니즘은 온톨로지라는 테크놀러지에 있다고 해도 무리는 아닐 것 같다. 에이전트 소프트웨어는 인간에게 이로운 기능을 한다는 점을 빼고는 블래스터 웜의 메커니즘, 즉 소켓 프로그래밍(Socket Programming)을 크게 벗어나지 않는다. 이러한 에이전트 소프트웨어가 지능을 갖는 인텔리전트 에이전트 소프트웨어의 역할을 하기 위해서는 `추론 엔진' 등과 같은 기능이 삽입되어야 하며, 이러한 지능은 온톨로지라는 이름의 방법론을 통해 연구되고 있다.

온톨로지의 실제 구현으로서, 유럽에서 시작된 OIL (Ontology Inference Layer)은 미 국방부(DARPA)의 시도였던 DAML(DARPA Agent Markup Language)과 병합되면서, W3C의 OWL (Ontology Web Language)의 시작점이 되어 진화를 거듭하고 있다. OWL은 현재 W3C의 권고사항으로 온톨로지 분야의 표준으로 자리잡을 것이 거의 확실시되고 있는 상황이다.

온톨로지라는 분야가 상용화된다면, 현재 많은 SF 영화에서의 장면이 현실화 될 것이다. 현재 이를 조금씩 기대할 수 있는 이유는 시만틱 웹을 어떻게 규정할까 하는 부분에 대한 개괄적인 합의가 이루어지고 있기 때문이다. 이러한 개괄적인 합의에 대한 한 규정은 RDF (Resource Description Framework)로 결실을 맺었다.

영화 속에서의 상상과는 달리 한 테크놀러지가 융성해지기 위해서는 반드시, 돈을 가져다 주는 기술이어야 하다. 이러한 이득은 몇몇 주도업체의 광고나 학계의 첨예한 이론에서가 아니라, 아주 평범한 소비자의 판단에 의존하는 것이 당연하다는 것을 우리는 `벤처거품'의 해체 과정에서 보았다. 그런 의미에서 시만틱 웹의 발걸음은 매우 바람직하다고 볼 수 있으며, 팀 버너스리의 난해한 논문과는 달리 그의 철학이 내뿜는 범용성(Universality)이 지속되는 한 웹이 소비자들에게 제공하고 있는 가치는 차세대 웹에서도 여전하리라고 여겨진다.

게시물수정

게시물 수정을 위해 비밀번호를 입력해주세요.

댓글삭제게시물삭제

게시물 삭제를 위해 비밀번호를 입력해주세요.