MY MENU

새로운 소식

[ 제품 및 다윈컨설팅에 대한 새로운 소식을 전달합니다. ]

제목

[한글 정보화 어디까지 왔나](중);정보검색기술

작성자
다윈컨설팅
작성일
2015.12.17
첨부파일0
조회수
795
내용
[한글 정보화 어디까지 왔나](중);정보검색기술

조규환 khcho@ 2004/10/11  
 
`질의응답형` 시스템 대세로

인터넷을 사용하는 이들은 대부분 검색사이트를 첫 페이지(초기화면)로 사용하고 있다.

정보검색은 그 만큼 인터넷 이용자들에게 친숙한 온라인 서비스다. 하지만 검색 만족도는 그다지 높지 않다는 것이 정설이다. 온라인 사용자들의 행태를 조사하는 닐슨노먼그룹의 `웹 유저빌리티 2004'를 보면 `성공적인 인터넷 사용을 저해하는 가장 큰 장애물'로 정보검색이 지목되고 있을 정도다. 원하는 정보를 정확하게 찾아주는 `맞춤형 정보검색' 기술의 중요성이 갈수록 증대되고 있는 것도 이런 이유에서다.

정보검색은 지난 1990년대 이전만 해도 도서관에서 서지 정보를 통한 문헌정보 검색이 대부분을 차지했다. 그러던 것이 1990대 후반 들어 인터넷이 급속도로 확산되면서 웹 정보검색의 필요성이 커지게 됐고, 정보검색의 부흥기가 도래했다. 이어 지식관리시스템(KMS)이나 전자문서관리시스템(EDMS) 등 다양한 정보시스템의 핵심기능으로 정보검색 엔진이 탑재되기 시작했다.

2000년 들어와서는 방대한 웹 정보를 효과적으로 제공하기 위한 디렉토리 검색기술과 사용자가 찾는 문서를 웹 상에 올려주는 검색기술이 개발돼 야후와 구글 등이 각광을 받게 된다. 최근에는 고급 자연어 처리기술과 텍스트 마이닝 기술을 이용한 의미 기반 문서검색이나 사용자의 자연어 질문에 정확히 하나의 답을 제공하는 질의 응답형 정보검색에 관한 연구까지 선보였다.

하지만 현재 정보검색 연구는 키워드 기반의 정보검색 수준에 그치고 있으며, 사용자가 원하는 정확한 정보를 제공하지 못한다는 지적을 받고 있는 것이 현실이다.

국내에서는 2000년 초 자연어 검색을 비롯해 질의 응답형 검색 서비스가 선보였지만 기술적 성숙도가 미흡해 사용자의 호응을 이끌어내는 데는 실패했다는 평이다.

미국의 경우, 국가적 차원의 개발 프로젝트를 통해 제한된 분야에 한해 질의응답 시범서비스를 실시하고 있다. 웹 공공 정보 대상의 `스타트(START) 프로젝트'와 미국 국방부 고도연구계획국(ARDA)의 `AQUAINT(Advanced QUestion&Answering for INTelligence)프로젝트', 그리고 표준기관인 NIST 주관의 TREC 질의응답 연구개발 로드맵 등도 요즘 한창 진행중인 대표적 사업으로 꼽힌다. AQUAINT 프로그램은 첨단 지능형 질의응답기술을 개발하기 위해 문서ㆍ음성ㆍ이미지ㆍ멀티미디어 등 자료를 영어는 물론 다국어로도 질의하고 답변할 수 있도록 하는 프로젝트의 하나다.

최근에는 세계적으로 월드 와이드 웹 컨소시엄(W3C)을 중심으로 한 시맨틱웹 표준화가 추진되고 있고, 시맨틱웹 기반의 온톨로지 구축 프로젝트 등도 이뤄지고 있다.

한국전자통신연구원(ETRI, 원장 임주환)도 시맨틱 웹 기반의 온톨로지 프로젝트를 진행한 경험이 있다. 산업적으로 보면 정보검색엔진은 인터넷 포털, KMS, EDM, 고객관계관리(CRM), 기업포털(EP), 전자상거래(EC), 자료관리시스템 등 거의 모든 정보시스템과 시스템통합(SI) 프로젝트의 핵심 컴포넌트라고 할 수 있다.

국내의 경우, 정보검색 산업은 인터넷의 확산으로 매년 30%이상 고속성장을 하고 있으며, 현재 30여개 검색엔진 개발 전문업체가 활동중이다. 하지만 시장진입 장벽과 자본력 등으로 외산이 여전히 전체 시장의 70%이상을 점유하고 있다. 

또한 최근 네이버ㆍ엠파스ㆍ야후 등 인터넷 포털업체들은 사용자에 의한 지식 검색에 관심을 기울이고 있다. 아울러 주요 정보추출ㆍ자동요약ㆍ문서자동분류 등 기능을 수행하는 텍스트마이닝 제품들이 출시돼 초기 시장을 형성하고 있다.

IBMㆍMS 등 다국적 기업들은 다국어 언어정보처리 및 다국어 언어지식자원 구축을 위한 장기 개발투자에 적극 나서고 있다. MS의 경우, 마인드넷(MindNet) 프로젝트에 심혈을 쏟고 있는 것으로 전해졌다.

웹 검색 정확도를 높여 돌풍을 일으킨 구글은 검색 엔진 기술로 세계 인터넷 서비스 시장을 주도하고 있으며, 기업용 검색엔진 시장에서는 미국의 베리티가 세계시장에서 20% 가량의 정보량을 취급하고 있다.

국내의 경우, ETRI가 지난 2003년부터 백과사전 지식 정보에 대해 사용자 질문에 정확한 답을 제시하는 백과사전 질의응답 시스템개발이 한창이다. 향후 음성 인터페이스기술과 결합해 지능형 로봇이나 텔레매틱스 등의 지능형 지식정보 검색기능으로 활용한다는 것이 ETRI의 복안이다.

장명길 ETRI 지식마이닝 연구팀장은 "정보검색 기술은 앞으로 질문응답형 정보검색 기술개발에 초점이 맞춰질 것으로 예상된다"며 "또한 바이오 분야 등의 특화된 정보검색과 다국어 검색기술이 개발되면 사용자가 보다 쉽게 국내외에서 지식정보를 얻을 수 있게 될 것"이라고 내다봤다.

게시물수정

게시물 수정을 위해 비밀번호를 입력해주세요.

댓글삭제게시물삭제

게시물 삭제를 위해 비밀번호를 입력해주세요.