1. 시맨틱 웹이란?
시맨틱 웹이란 무엇인가? 시맨틱 웹을 정의하기 위해서는 먼지 '시맨틱'의 의미를 이해해야한다. 시맨틱은 신택스와 구분되는 개념이다. 신택스가 어떤 문구 자체를 가리킨다면, 시맨틱은 문구 안에 포함된 개념을 뜻한다. 예를 들어 "I love music"이라는 문장은 신택스의 측면에서 문법적으로 올바른 것이고, 시맨틱의 측면에서 나는 음악을 사랑한다라는 의미를 가지는 것이다. 즉, 시맨틱 웹은 웹과 시맨틱이 결합된 것으로 웹이 단순히 링크로 연결된 페이지의 집합이 아니라, 페이지들과 페이지들 간의 링크에 의미를 부여, 나아가 웹 상의 데이터들을 서로 연결하고 그것들에 의미를 부여하는 것이다. 예를 들어 'SNU is in Seoul'과 'I'm a student of SNU'라는 데이터가 웹에 존재할 때, 이런 데이터들을 연결하여 'I am in Seoul'이라는 새로운 데이터를 웹이 추론할 수 있는 것이다. 다시 말해 현재의 웹 문서와 달리, 정보자원들 사이에 연결되어 있는 의미를 컴퓨터가 이해할 수 있는 형태의 언어로 바꾸어 컴퓨터가 정보자원의 뜻을 해석하고, 기계들끼리 서로 정보를 주고받으면서 자체적으로 필요한 일을 처리하도록 하는것이다.
이러한 시맨틱 웹은 웹의 창시자 팀 버너스리가 월드와이드웹(WWW)을 개발한 후 얼마 지나지 않아서부터 계획했던 것이지만 그 동안은 이를 구현하기엔 웹 환경이 너무 열악했다. 그러나 오늘날 웹이 지속적으로 발전하면서 웹에 존재하는 데이터의 양이 폭발적으로 증가함에 따라 기존의 단순 텍스트 검색 결과만으로는 사용자들이 원하는 정보를 충분히 제공하기 힘들게 되었고 그에 따라 필연적으로 시맨틱 웹의 필요성이 증가했으며 기술적으로 시맨틱 웹의 구현이 가능해지고 있다.
시맨틱 웹 관련 연구는 W3C를 중심으로 한 RDF(Resource Description Framework)를 기반으로 한 온톨로지 기술과 국제표준화기구(ISO) 중심의 토픽 맵(Topic Map) 기술이 주류를 이루고 있다.
온톨로지 기술은 사람들의 공동의 합의를 이룬 개념을 컴퓨터에서 다룰 수 있는 형태로 표현한 모델로, 개념의 종류나 사용상의 제약조건들을 명시적으로 정의한 기술이다. 가장 기초적인 온톨로지 언어로는 RDF를 꼽을 수 있는데, 이는 레코드(record)를 하나의 기술 단위로 취급해온 기존의 방식과 달리 자원, 속성, 속성 값을 하나의 단위로 취급하는 이른바 “Triple”개념이 그 기술적 핵심이다. 즉 레코드를 자원을 나타내는 주어(Subject), 속성을 나타내는 술어(Predicate), 속성의 값을 나타내는 목적어(Object)로 나눈다. 이와 같은 자원 속성 표현의 세분화로 인해 자원에 대한 좀더 정교한 기술이 가능해지고, 자원들 간의 관계 설정이 속성(Predicate)을 통해 무한대로 가능하게 된다. 각각의 자원들을 URI를 통해 고유 식별자를 가지게 되고 자원을 기술하는 속성 명 또한 고유한 URI를 통해 XML Namespace에 정의된 속성을 사용함으로써 상호간 의미 충돌을 막는다. 속성의 값으로 다른 URI가 지정될 수 있으며, 속성 값으로 지정된 자원 역시 다시 기술의 대상이 되기 때문에 그 자원에 대한 속성과 속성값을 다시 부여할 수 있다. 요컨대, 온톨로지 기술은 정보시스템의 대상이 되는 자원의 개념을 명확하게 정의하고 상세하게 기술하여 보다 정확한 정보를 찾을 수 있도록 하는 것이다.
다음으로 토픽 맵은 ISO/IEC 13250 표준으로 지식 표현 기술(Knowledge Representation)의 표준이다. XML 기반의 표준 기술 언어인 XTM(XML Topic Maps)라는 언어를 사용하여 정보와 지식의 분산관리를 지원한다. 토픽 맵은 정보를 상호 연관성에 따라 연결하고 조직하여 지식 구조를 일종의 지도(Map)와 같이 표현하여, 대용량의 정보를 분류하고 의미론적 연관관계를 검색하는 데 사용할 수 있는 탁월한 기술로, 정보세계의 GPS라고 할 수 있다. 또한 토픽 맵은 대용량의 정보를 분류하고 구조화하며 의미론적인 연관관계를 설정하여, 비구조화되고 분산되어 있는 정보를 효율적으로 통합, 검색하고 네비게이션하기 위한 해결책으로 제시되었다. 즉 토픽 맵은 정보 자원의 구성, 추출, 네비게이션에 관계하는 새로운 패러다임으로 정보와 지식 관리를 위해 최적화된 표현 양식을 제공하고 있다. 토픽 맵은 지식층과 정보층의 이중 구조로 구성된다. 지식층은 상위 계층으로 토픽(topic)과 토픽간의 연계로 구성된다. 토픽은 특정 주제를 나타내는 표현이고 연계는 주제들 간의 관계를 나타내는 표현이다. 정보층은 디지털 컨텐츠를 나타내며, 이들 지식층과 정보층은 어커런스(Occurrence)를 통해 상호 연결이 이루어진다.
시맨틱 웹은 기술은 1)데이터 연계, 통합, 상호운영, 2)검색과 분석 3)상황인지 같은 데이터 지능화 부분에서 응용/개발되고 있다. 아래의 표는 시맨틱 웹 기술이 응요되고 있는 사례들을 정리해 놓은 것인데, 이를 통해 데이터 통합과 정보 검색이 대표적인 응용 영역임을 학인할 수 있다.
(표. 시맨틱 웹 기술 응용 현황)
실제로 많은 프로젝트에서 시맨틱 웹에 기반한 접근 방법과 기존의 RDB에 기반한 접근 방법을 상호보완적으로 통합하여 성능과 비용의 측면에서 시너지효과를 내고있는데, 이를 통해 데이터 모델 자체가 의미적 데이터 상호 운영 및 데이터 연계성을 지원하게된다.
2. 시맨틱 웹 기술을 응용한 사업?
시맨틱 웹 기술을 응용에 관한 표에서, 시맨틱 웹 기술이 서비스 비즈니스에 응용되고 있음을 보았다. 특히 음악 추천 등 음악분야에서도 이 기술이 응용되고있음을 알 수 있다. 시맨틱 웹을 공부하면서 문득, 내가 전공하고 있는 음악학에 이 기술을 응용하면 세계 각지에 흩어져있는 (세계의 각 학술사이트에 흩어져있는) 정보(논문)을 통합하고, 음악학도들이 더욱 간편하게 정보를 수집해 수준 높은 연구를 할 수 있겠다는 생각이 들었다.
그래서 여건이 된다면 시맨틱 웹 기술과 인터넷 운영체제 기술을 결합하여 <음악학 논문 아카이브> 서비스 사업을 시작해보고 싶다. 음악학을 공부하는 학생으로서 평소에 가장 어려운 점은, 음악학이 서양을 중심으로 진행되는 학문이다 보니 한국어로 된 논문이나 레퍼런스가 부족하다는 점이다. 게다가 음악학은 미국보다도 유럽에서 더 발달하고 있는 학문이기 때문에, 독일어/프랑스어 레퍼런스가 필요한 경우가 많다. 그러나 현재 우리나라의 RISS나 KISS등은 거의 대부분 미국의 레퍼런스만을 서비스하고 있다. 그래서 음악학을 공부하는 학생들이 독일어 레퍼런스를 찾고 싶을 때는 독일의 포탈에 직접 접속하여 검색을 해야 하는 번거로운 작업을 해야 하며, 익숙하지 않은 독일의 포탈에서 정확한 자료를 찾는 것 역시 굉장히 어려운 일이다.
그런데, 이러한 문제는 시맨틱 웹 기술을 적용시키면 해결할 수 있다. 전 세계의 레코드를 세분화하여 기계가 식별할 수 있는 통일된 ID를 부여한다면, 다른 나라의 웹 사이트에서 더 정확한 검색이 가능할 것이다. 또한 이를 더욱 발전시킨다면 하나의 웹 사이트에서 전 세계의 자료들을 정확하게 검색하는 것이 가능할 것이고 더 나아가 사용자가 다른 나라의 언어에 익숙하지 않더라도 정확하고 풍부한 자료를 검색할 수 있을 것이다. 따라서 시맨틱 웹을 적용한 거대한 <음악학 논문 아카이브>를 구축한다면, 음악학도나 음악학에 관심이 있는 사용자들이 웹의 여기저기를 돌아다니지 않고도 정확-풍부한 자료를 검색할 수 있을 것이다. 예를 들어 독일의 작곡가 슈톡하우젠의 경우, 독일에서는 현대음악의 전설로 남아있는 작곡가지만 우리나라에서는 연구가 거의 되어있지 않아서, 그 작곡가를 연구하기 위해서는 독일어 논문을 보는 것이 필수적이다. 그러나 현재는 한국에서 그 자료를 구하는 것은 매우 어려워 현대음악을 연구하는 모든 사람들이 연구에 큰 고난을 겪고 있다. 여기에 시맨틱 웹 기술을 적용한다면, “Stockhausen”이라는 subject에 전 세계적으로 통일된 고유 ID부여하고, 사용자가 그 주제어를 검색하기만 하면 기계가 알아서 전 지구상의 웹에 있는 관련 자료를 검색해 줄 수 있다. 그리고 이 외에도 동명이인에 대한 검색의 정확도를 엄청나게 높일 수 있고, 두 개 이상의 주어/목적어/술어를 입력했을 때 사람이 직접 하는 것 보다 더욱 풍부한 자료를 검색하는 것이 가능할 것이다.
한편 시맨틱 웹 기술을 적용한 <음악학 논문 아카이브>에 웹 OS 기술을 결합시키면 아카이브에 대한 접근성을 높일 수 있을 것이다. 우선 웹 OS기술을 통해 퍼스널 아카이브 구축 서비스를 제공할 수 있다. <음악학 논문 아카이브>에서 검색한 자료를 다운받아 PC의 하드디스크에 저장하는 것이 아니라, web os의 어플리케이션(예를 들어 맥의 paper같은)과 연동시켜 웹에 저장하는 것이다. 그렇게 되면 웹에 퍼스널 아카이브가 구축이 될 것이다. 대부분의 음악학도들이 항상 종이를 통해 논문을 보거나 그때 그때 논문을 보는데 급급하기 때문에 개인적인 아카이브를 구축한다는 게 참 힘들다. 따라서 web os의 어플리케이션과 연동한 자동적으로 구축되는 퍼스널 아카이브는 음악학도들의 가장 큰 자산이 될 것이다.
또한 클라우드 컴퓨팅 기술을 적용시켜 사용자가 공간의 제약 없이 자신의 모바일 디바이스로 웹 아카이브에 접속할 수 있도록 하고, 그 컨텐츠를 N-screen의 시대에 맞추어 해상도를 유동적으로 조절할 수 있게 하면 웹 아카이브의 편의성과 접근성이 대폭 증가할 것이다.
이 뿐만 아니라 web os의 다양한 어플리케이션과 웹 아카이브를 연동하여 웹 상에서 편집, 작업 스케줄링 서비스 등을 제공한다면, 사용자들은 한 곳에서 모든 작업을 다 할 수 있게 될 것이다. 이렇게 되면, 이 거대한 <음악학 논문 아카이브>는 사용자- 논문작업에 필요한 어플리케이션을 개발하는 사람- 컨텐츠(논문) 작성자 등 여러 관계자들이 모이는 플랫폼으로까지 성장할 수 있을 것이다.
3. 시맨틱 웹과 플랫폼 전략
앞서, 시맨틱 웹을 응용한 사업을 구상하면서, 개발한 사이트를 하나의 플랫폼으로 성장시킬 수 있을 것이라는 생각이 들었다. 물론, 내가 구상한 것은 web OS와 시맨틱 웹 기술을 함께 결합하여 개발한 사이트에 다양한 비즈니스를 얹는 것이였지만, 생각이 여기까지 미치고나니 시맨틱 웹 기술 자체가 비즈니스 측면에서 플랫폼 전략에 유용하게 쓰일 수 있겠다는 생각이 들었다.
먼저, 플랫폼 전략이란 관련이 있는 여러 그룹을 플랫폼을 불러모아 관계 형성이가 고객 모집 등 다양한 기능을 제공하고 검색이나 광고등의 비용을 줄여 입소문과 같은 네트워크 효과를 창출하여 새로운 생태계를 구축하는 전략이다. 예를 들어, 신용카드, 쇼핑몰, 플레이스테이션, windows, SNS, 도코모, 스마트폰의 앱스토어를 플랫폼이라 부를 수 있다. 좀 더 자세히 말해 페이스북은 SNS사용자, 게임 이용자, 게임 개발자, 광고주 등을 불러모은 하나의 플랫폼으로 플랫폼에 참여한 구성원 모두에게 이익을 가져다주는 비즈니스 모델을 창출한 것이다. 즉, 앞서 내가 구상한 사이트는 그것을 이용하는 사용자들과 컨텐츠를 작성하는 제작자, 그리고 웹 사이트에서 제공하는 다양한 어플리케이션을 제공하는 개발자 등을 불러모아 각자에게 이득을 가져다주는 멀티사이디드(multi-sided) 비즈니스 모델을 구축하는 하나의 플랫폼이다. 또한 페이스북이 게임과 tageted ad.를 플랫폼으로 끌어들여 지속적으로 성장한것 처럼, 앞서 말한 기본적인 구조위에 스트리밍 서비스나 음악 추천 서비스, 번역 서비스 등이 얹혀지면 이는 무궁무진하게 성장할 수 있을 것이다. 이처럼 플랫폼 전략은 21세기에 고도의 성장을 지속적으로 이루어내기 위해 모든 분야에 필요한 비즈니스 전략인 것이다. 그렇다면 과연 시맨틱 웹이 어떻게 IT분야의 플랫폼 전략에 도움을 줄 수 있을까?
내가 구상한 <음악학 아카이브>가 성공하기 위한 가장 중요한 요인은 무엇일까? 애초에 사용자가 한 곳에서 모든 정보를 얻고, 모든 작업을 할 수 있도록 만든 사이트이기 떄문에 그 사이트는 굉장히 덩치가 클것이다. 사이트 자체에 방대한 양의 정보가 저장되어 있을 것이고, 게다가 플랫폼에 모여있는 각각의 그룹이 각기 다른 다양한, 이질적인 정보를 별도로 운영하고 있다. 만약 이렇게 방대한 양의 정보를 중구난방으로 사용자에게 제공한다면 이 사이트는 의미가 없는 커다란 쓰레기 장이 되어버릴지도 모른다. 따라서 각기 분리되어 운영되는 방대하고 이질적인 정보를 잘 조직하여 사용자에게 보여주는 것이 이 사이트가 성공하는 데에 중요한 첫 번째 요소이고, 이는 다른 플랫폼의 경우도 마찬가지이다. 즉, 거대하고 이질적인 정보 중에서 유의미한 것들을 골라 잘 조직해 보여주여주어 서비스의 질을 높이면서도 이에 대한 비용을 줄이는 것이 관건이다. 기존의 키워드 검색만으로 이러한 서비스를 제공하는 데는 한계가 있다. 반면 시맨틱 웹은 의미기반 검색을 가능하게 한다는 점에서 플랫폼 전략이 성공하기 위한 서비스를 구축하는데 유용하다.
한편, <음악학 아카이브>의 성공화에 중요한 또 다른 포인트는 서비스의 '커스터마이징' 또는 '개인화'이다. 여러 정보를 한데서 찾고 가공하여 결국은 개인의 아카이브를 구축한다는 것이 이 서비스의 포인트이기 때문이다. 또 다시 페이스북을 예로 들어보면, 개인의 성향을 파악에서 그에 맞는 광고를 보여주거나 개인의 정보를 기반으로 친구를 추천해 주는 기능이 있는데 이 역시 서비스의 개인화라고 볼 수 있다. 사람들은 SNS를 이용하면서 '나'에게 적합한 서비스를 이용하기를 바란다. 마치 거대한 저택에서도 자신만의 공간을 가지고 그것을 꾸미고 싶어하는 사람처럼 말이다. 한편 아이튠즈의 지니어스처럼 음악분야에서도 사용자 개인을 위한 음악 추천 서비스에 대한 연구가 활발하게 진행되고 있다. 이와 같은 서비스의 개인화를 위해서는 사용자의 정보나 성향, 위치 등을 바탕으로 새로운 정보를 추론하는 과정이 필요한데, 이 과정에서 시맨틱 웹 기술을 유용하게 사용할 수 있다. 즉 시맨틱 웹 기술을 이용한 사용자 상황, 선호정보, 사회망 분석등을 통해 개별적인 콘텐츠 추천 등 사용자에게 적합한 서비스를 제공할 수 있는 것이다.
요컨대, 시맨틱 웹은 플랫폼이 성공하기 위한 두 가지 요소 1)다양한 데이터, 서비스 리소스의 재활용과 생산성 향상, 즉 상호운용성과 2)맞춤형 서비스를 구축하는데 중요한 역할을 한다. 앞으로 시맨틱 웹은 단순한 기술을 넘어 플랫폼 산업이 성장하는 원동력이 될 것이다.
*Reference*
시맨틱 웹 : http://ko.wikipedia.org/wiki/시맨틱_웹
http://blog.saltlux.com/wp-content/uploads/Semanticweb&tech_3th.pdf
시맨틱 웹의 기술 : http://robomania.tistory.com/15
http://holik.org/2010/06/06/semantic-web/
시맨틱 웹과 플랫폼: http://blog.naver.com/june820?Redirect=Log&logNo=80083284720
히라노 아쓰시 칼, 안드레이 학주 <플랫폼 전략>, 더 숲, 2011.