특허권

음성 포탈서비스를 위한 보이스엑스엠엘 텔레게이트웨이시스템

상품번호 2019062500115011
IPC 한국(KO) 등록
출원번호 1020000077889
공개번호 10-2002-0048669
등록번호 1003720070000
출원인 글로웍스 주식회사,정보통신연구진흥원,주식회사 케이티
판매가 0원
 

꼭 읽어보세요!

기술거래는 양방향 경매방식으로 이루어집니다.

기술을 매수한 당사자는 거래금액의 전부 혹은 10퍼센트(%)를 당일 본원에 입금하여야 하며, 10% 나머지 잔금은 거래일로부터 2일 이내(거래일 익일)에 납부하여야 합니다. 만약 위 지정 기간내에 매수자가 입금하지 않으면 거래는 무효가 되며, 잔금도 기한내에 입금되지 않으면 매도자로 귀속됩니다. 이는 매도자의 기한의 이익상실을 보장함 입니다.

기술거래의 수수료는 기술의 이전 및 사업화 촉진에 관한 법률 시행규칙 산업통상자원부령 제48호 의거 기술이전 금액의 13퍼센트∼기술이전 금액의 17.5퍼센트로 되어있지만, 본 거래사이트에서는 매도‧매수인 각각 10%로 합니다.
이때 매수인의 매수금액(당사로 입금되는 금액)에서 수수료 각각10% 인 20%를 공제한 후 매도인에게 계좌이체를 하여야 합니다.
또한 권리이전(특허)비용은 기술양수인(매수자)부담이며 그 비용은 별도입니다.

 
본 발명은 음성포탈서비스를 제공하는데 있어 가입자와 서비스 제공자 사이의 인터페이스 역할을 하는 보이스XML 텔레게이트웨이(VoiceXML TeleGateway) 시스템에 관한 것이다. 본 발명은 기존의 ARS 서비스가 정해진 시나리오에 따라 미리 녹음된 멘트를 송출하고 한번 정의된 시나리오는 수정하기 어려운 점을 보완하여 별도의 서비스 제공자가 시나리오를 표준화된 VXML 문서로 직접 작성하면 보이스XML 텔레게이트웨이(VoiceXML TeleGateway) 시스템은 이 시나리오를 진행하는 사업 방식에 관한 것으로, 서비스 제공자가 작성한 표준화된 VXML 문서를 가져오고 이를 처리하는 데 필요한 정형화된 보이스XML 텔레게이트웨이(VoiceXML TeleGateway) 시스템의 API 자체 구현에 관한 것을 제공하며, 보이스XML 텔레게이트웨이(VoiceXML TeleGateway)를 통해 음성포탈서비스를 진행하는 방법에 있어서 서비스 제공자와 시스템 사업자간의 인터페이스를 단순한 표준화된 방식으로 제공하기 위해 입력 부분과 출력 부분의 두 가지 API 만으로 모든 요구사항을 처리하도록 한 것이다.

색인어
음성포탈서비스, 전화번호 안내서비스, 텔레게이트웨이, API, Vxml
명세서
도면의 간단한 설명
도 1은 일반적인 음성포탈서비스의 시스템 구성 예시도.
도 2는 본 발명이 적용되는 음성포탈서비스를 연동시키기 위한 시스템의 구 성 예시도.
도 3은 도 2의 상세 구성도.
< 도면의 주요 부분에 대한 부호의 설명
1:유선전화기 2:무선전화기
3:PSTN망 5:인터넷망
40:텔레게이트웨이 41:인터프리터
42:코먼API 43:ASR
44:TTS 60, 70:Vxml기반 웹서버
발명의 상세한 설명
발명의 목적
발명이 속하는 기술 및 그 분야의 종래기술
본 발명은 음성포탈서비스를 제공하는데 있어서 가입자와 서비스 제공자 사이의 인터페이스 역할을 하는 보이스XML텔레게이트웨이(VoiceXML TeleGateway) 시스템에 관한 것이다.
일반적인 음성포탈서비스에서는 웹 서버의 시나리오가 HTML, XML 등의 일반적인 문서 또는 자체 시스템에 의존적인문서가 됨으로써 보이스 게이트웨이는 웹 서버와 항상 공존하는 관계가 된다.
도 1은 종래 음성포탈서비스의 시스템 구성도로서, 사용자가 유선 전화기(1) 또는 무선 전화기(2)를 사용하여 PSTN망(3)을 통해 서비스 제공자에게 전화를 걸면 보이스 게이트웨이(4)가 인터넷망(5)을 통하여 웹 서버(2)에서 시나리오를 가져와서 진행을 하였다.
그러나 이와 같은 종래의 음성 포탈서비스의 시스템에 있어서는, ARS서비스가 정해진 시나리오에 따라 미리 녹음된 멘트를 송출하고 한 번 정의된 시나리오는 수정하기 어려운 결점이 있었다.
발명이 이루고자 하는 기술적 과제
본 발명은 이와 같은 종래의 문제점을 해결하기 위한 것으로, 본 발명의 목적은, 별도의 서비스 제공자가 시나리오를 표준화된 VXML문서로 직접 작성하면 보이스XML 텔레게이트웨이(VoiceXML TeleGateway) 시스템에서 이 시나리오를 진행하도록 하는 음성 포탈서비스를 위한 보이스XML 텔레게이트웨이(VoiceXML TeleGateway) 시스템을 제공하는데 있다.
발명의 구성 및 작용
이와 같은 목적을 달성하기 위한 본 발명은 음성포탈서비스를 통해 음성서비스를 안내하는 방법에 있어서, 기존에 녹음된 음성파일을 송출하며 출력의 역할을 담당하는 PA()와, 주어진 음성 및 텍스트를 송출하면서 사용자로부터 DTMF또는 음성을 입력받는 PCUI()를 포함하여 구성함을 특징으로 한다.이하, 본 발명의 실시 예를 첨부된 도면을 참고로 하여 상세히 설명하면 다음과 같다.
도 2는 본 발명이 적용되는 음성포탈서비스를 연동시키기 위한 시스템의 구성 예시도로서 사용자가 유선 전화기(1) 또는 무선 전화기(2)를 사용하여 PSTN망(3)을 통해 서비스 제공자에게 전화를 걸면 텔레 게이트웨이(40)가 인터넷망(5)을 통하여 Vxml기반 웹 서버(60)(70)에서 시나리오를 가져와 진행을 하도록 구성된 것이다.단, 상기 텔레게이트웨이(40)와 웹 서버(60)(70)는 독립적인 형태로 존재할 수 있다.도 3은 상기 도 2의 상세 구성도로, 텔레게이트웨이(40)가, VXML 시나리오 문서를 해석해서 VRU에게 필요한 명령을내리고 다시 명령을 기다리는 명령이 들어오면 다음 시나리오를 진행하는 시나리오 해석기인 인터프리터(41)와, PSTN망(3)을 통해서 들어오는 음성 및 DTMF 톤을 받거나 다시 사용자에게 음성을 들려주는 제어부분과 함께 인터프리터(41)와 ASR, TTS를 통합 제어하며, 사용자에게 멘트를 송출하는 코먼 API(42)와, 상기 코먼 API(42)에 접속되며,음성을 인식하는 음성 인식기인 ASR(Automatic Speech Recognition)(43) 및 음성 합성기인 TTS(Text To Speech)(44)를 포함하여 구성된 것으로, 도면중 미설명 부호 45는 상기 코먼 API에 포함되는 NMS보드이다.
이와 같이 구성된 본 발명의 작용을 설명하면 다음과 같다.
먼저, 보이스XML 텔레게이트웨이(VoiceXML TeleGateway)의 경우 어떤 표준화된 API를 가짐으로써 표준 문서인VXML을 이용하여 서비스가 구축된 웹 서버와는 무조건 연동 가능하다.서비스 사업자는 언제든지 제공중인 서비스 시나리오를 변경할 수 있으며 자체 개발된 보이스XML 에디터를 이용하여쉽게 서비스를 구축할 수 있다. 이때, 보이스XML 텔레게이트웨이(VoiceXML TeleGateway)에는 VXML 문서를 다운받아 이를 해석하여 시나리오를 진행하는 인터프리터(41)를 내장하고 있는데 두 가지의 API를 이용하여 인터프리터(41)는 외부 인터페이스 기능을 수행할 수 있다.결국 제시된 2가지 API를 통해서 음성포탈서비스에서 제공되는 모든 처리가 가능하도록 본 시스템은 이루어져 있다.상기한 바와 같은 음성포탈서비스를 효율적으로 서비스하기 위해서 다양한 프로그램 기술이 들어갈 수 있는데 여기서는 보이스XML 텔레게이트웨이(VoiceXML TeleGateway)(40)에 2가지 API만을 적용하여도 다양한 서비스가 가능하다는 것이 특징이다.
본 발명에서는 제시하는 2가지 API는 다음과 같다.
첫 번째 PA()로, 이는 인터프리터(41)가 보이스XML 문서를 파싱(parsing)한 후에 서비스를 진행하는 과정에서 사용자에게 출력을 하기 위한 기능으로 사용하는 것이다.예를 들면, "잠시만 기다려 주십시오" 와 같은 멘트 출력에 적용되는데 PA() API의 구성요소는 PA(int nMsgIDType, int nSnglMsgID, char *szMsgContent) 이다.먼저, int nMsgIDType 은 기존에 녹음되어 있는 음성파일을 송출할 것인가, 아니면 텍스트를 음성으로 변화하여 송출할 것인지를 나타내는 변수로, 1이면 음성파일, 2이면 텍스트를 나타낸다.또한, int nSnglMsgID는 nMsgIDType이 1일 경우 음성파일 번호를 나타내는 것으로, 음성파일번호가 넘어오면 해당음성파일을 송출하면 되며, nMsgIDType이 2일 경우는 의미가 없다.또한, char *zMsgContent는 nMsgIDType이 2일 경우에 송출할 텍스트 내용을 나타내는 것으로, 예를 들어, "안녕하십니까? 로커스에서 제공하는 음성포탈서비스입니다. 오늘의 날씨는 1번, 증권정보는 2번을 눌러 주십시오"와 같은 텍스트가 있을 경우 해당 텍스트를 음성으로 바꾸어 송출한다.
정리하면 PA()는 해당 멘트(음성, 텍스트)를 송출하지만 사용자의 입력은 받지 않는 API이다.
위의 3개의 파라메타로서 PA()는 멘트 송출시 이미 녹음된 음성 파일과 텍스트를 음성으로 변환하는 방법의 모든 경우를 나타낼 수 있다.한편, 두 번째는 PCUI()로, 인터프리터(41)가 보이스XML 문서를 파싱(parsing)한 후에 사용자로부터 입력을 받을필요가 있을 때 사용하는 것이다.예를 들면, "오늘의 날씨는 1번, 증권정보는 2번입니다" 처럼 사용자로부터 입력을 받을 필요가 있을 때 사용하는 API이다.PCUI(int nMsgIDType, int nSnglMsgID, char *szMsgContent, int nMinOfDgt, int nMaxOfDgt, int nTermFirstDigit, int nTermSecondDigit, char *szCollectedDigit, int AsrCount, char **AsrResult, int n보이스Information) 이다.여기서, int nMsgIDType, int nSnglMsgID, char *szMsgContent 는 상기 PA()에서 설명한 것과 동일하며, 결국 PCUI()는 PA()의 기능과 나머지 파라메터 기능을 합쳐놓은 것과 같은 것이다.또한, int nMinOfDgt은 사용자로부터 DTMF를 입력받을 때 최소 몇 자리를 받을 것인지를 나타낸다.예를 들면, "귀하의 계좌번호와 우물정자를 눌러 주십시오" 하면 계좌번호는 은행마다 다르기 때문에 최소 계좌번호 개수가 다를 것이며, 계좌번호가 최소 10자리이면 10이 된다.또한, int nMaxOfDgt은 사용자로부터 DTMF를 입력받을 때 최대 몇 자리를 받을 것인지를 나타낸다.예를 들면, "귀하의 계좌번호와 우물정자를 눌러 주십시오" 하면 계좌번호는 은행마다 다르기 때문에 최대 계좌번호 개수가 있을 것이며, 계좌번호가 최대 20자리이면 20이 된다.또한, int nTermFirstDigit은 사용자로부터 DTMF를 입력받을 때 입력 종료를 나타내는 특정 값이 필요할 경우 이를명시하는 첫 번째 값으로, 예를 들어, "귀하의 계좌번호를 누르신 후 우물정자를 누르시오" 하면 nTermFirstDigit은우물정자(#)가 된다.또한, int nTermSecondDigit은 사용자로부터 DTMF를 입력받을 때 입력 종료를 나타내는 특정 값이 필요할 경우 이를 명시하는 두 번째 값으로, 예를 들어, "귀하의 계좌번호를 누르신 후 우물정자나 별표를 누르십시오" 하면 nTermSecondDigit 은 별표(*)가 된다.또한, char *szCollectedDigit 은 사용자가 입력한 DTMF를 보관하는 버퍼로, 사용자가 1, 2, 3, 4, 5, 6 을 입력했다고 가정하면 123456이 저장되어 있으며, 인터프리터에게 넘겨주면 인터프리터는 입력 값을 비교해 본 후 다음 시나리오를 진행하게 된다.또한, int AsrCount는 사용자가 음성을 입력했을 경우에 해당하며, 입력된 음성을 음성인식엔진에서 처리한 후 엔진에의해 인식된 단어 수를 나타내는 것으로, 예를 들어, 주식조회에서 종목명을 "삼성전자" 라고 녹음하면 AsrCount는 1이 될 것이고 "삼성전자 우선주"하면 AsrCount는 2가 될 것이다. 또한 존재하지 않는 종목명 "삼성전자" 를 입력하면AsrCount 는 0이 될 것이다.
또한, char **AsrResult는 사용자가 입력한 음성을 음성인식엔진에서 처리한 후 리턴해 주는 종목명(텍스트)으로, 예를 들면, 사용자가 삼성전자 또는 삼성을 녹음했을 때 음성인식엔진에서 삼성전자를 리턴해주면 AsrResult에는 "삼성전자"가 들어가게 된다.
또한, int n보이스Information은 사용자로부터 입력받는 값의 범위를 나타내는 것으로, 예들 들면 1이면 DTMF만 입력받고 2이면 DTMF와 음성 모두를 입력받게 된다.
따라서, 이상의 2가지 API를 통해서 음성포탈서비스가 제공하는 모든 서비스에 적용 가능하게 되는 것이다.
발명의 효과
이상에서 설명한 바와 같은 본 발명은 음성포탈서비스를 제공함에 있어서 다양한 처리를 보이스XML 텔레게이트웨이(VoiceXML TeleGateway)의 2가지 정형화된 API로 모두 처리할 수 있으며, 컨텐츠 사업자가 표준화된 VXML 기반의 시나리오 문서를 제공할 경우 무조건 연동이 가능한 효과가 있다.즉, 본 발명은 시스템 개발자의 입장에서 사용자와의 입출력 처리를 두 가지 API만으로 모두 수용할 수 있고, 서비스제공자의 입장에서는 쉽고 빠르게 원하는 서비스를 구축할 수 있는 효과가 있다.
(57) 청구의 범위
청구항 1.
PSTN망에 연결되는 유, 무선 전화기에 보이스XML 텔레게이트웨이(VoiceXML TeleGateway)를 통해서 음성포탈서비스를 제공하는 방법에 있어서,상기 PSTN망과 인터넷망 사이에 접속되며, VXML 시나리오 문서를 해석해서 VRU에게 필요한 명령을 내리고 다시 명령을 기다리는 명령이 들어오면 다음 시나리오를 진행하는 시나리오 해석기인 인터프리터, PSTN망을 통해서 들어오는음성 및 DTMF 톤을 받거나 다시 사용자에게 음성을 들려주는 제어부분과 함께 인터프리터와 ASR, TTS를 통합 제어하며, 사용자에게 멘트를 송출하는 코먼 API, 상기 코먼 API에 접속되며, 음성을 인식하는 음성 인식기인 ASR 및 음성 합성기인 TTS로 된 텔레게이트웨이와;상기 인터넷망에 접속되는 다수의 Vxml기반 웹서버;를 포함하여 구성된 것을 특징으로 하는 음성 포탈서비스를 위한 보이스XML 텔레게이트웨이(VoiceXML TeleGateway) 시스템.
청구항 2.
제 1 항에 있어서, 상기 텔레게이트웨이가, 기존에 녹음된 음성파일을 송출하며 출력의 역할을 담당하는 PA()와, 주어진 음성 및 텍스트를 송출하면서 사용자로부터 DTMF 또는 음성을 입력받는 PCUI()를 포함하여 구성된 것을 특징으로 하는 음성 포탈서비스를 위한 보이스XML 텔레게이트웨이(VoiceXML TeleGateway) 시스템.
도면
도면 1
도면 2
도면 3
도면 4
도면 5
도면 6 

등록된 상품문의

  • 상품문의가 없습니다.

등록된 사용후기

  • 사용후기가 없습니다.