웹 기반의 언어자원 객체화에 근거한 사전 개발 시스템
페이지 정보
작성일 23-01-26 11:27본문
Download : .hwp
웹 기반에서 객체화된 언어자원들은 다양한 응용 시스템 개발에 간단한 방법으로 이용되어 강력한 자연언어처리 응용 시스템을 구성할 수 있다.
[4] 최병진 외3, “표준화를 위한 일반사전의 논리 구조”, 한국정보과학회&한국인지과학회, 제8회 한국어 정보처리 학술대회 논문집, pp.415-423, 1996.
[7] 최용준, 황도삼, 최기선, “YDK : 한국어 통합정보사전 개발시스템의 설계 및 구현”, 한국정보과학회, 한국정보과학회 추계학술발표회논문집, 1998년 10월.
[2] 이재성 외3, “텍스트 및 전자사전 관리시스템의 설계”, 한국정보과학회 & 한국인지과학회, 제8회 한국어 정보처리 학술대회 논문집, pp.408-414, 1996.
4.2 YDK2000의 구현
3.3 익스트라넷(Extranet)
1. 서론
[8] 최용준, 황도삼, 최기선, “YDK-Term : 한국어용언의 다국어 통합정보사전”, 한국인지과학회&한국정보과학
다. 개발한 YDK2000은 기존의 각종 사전의 여러가지 사전정보를 통합할 수 있을 뿐 아니라 여러 자연언어처리 시스템들과의 Internet 접속을 통해 언어처리를 위한 사전정보를 손쉽게 통합할 수 있어 고품질의 사전을 개발할 수 있다. 또한, 초기 개발 이후에 이루어진 각 언어자원들의 개량은 별도의 처리과정 없이 자동으로 각 응용 시스템에 반영되므로 효과(效果)적인 유지보수가 가능하다는 advantage(장점) 이 있다. YDK2000은 기존의 각종 사전의 다양한 사전정보를 통합할 수 있을 뿐만 아니라, 여러 자연언어처리 시스템들과 Internet 접속을 통해 언어처리를 위한 사전정보를 손쉽게 통합할 수 있어 고품질의 전자사전을 개발할 수 있는 자연언어처리 응용 시스템이다. 웹 기반에서 객체화된 언어자원들은 다양한 응용 시스템 개발에 간단한 방법으로 이용되어 강력한 자연언어처리 응용 시스템을 구성할 수 있다. 이러한 전자사전을 기반으로 하여 개발되는 자연언어처리 시스템들은 사전의 變化(변화)에 영향을 받게 되며, 필요로 하는 전자사전들을 시스템 내에 모두 설치해두어야 하는 결점들을 갖고 있다[1-3]. 뿐만 아니라. 응용 시스템이 다른 자연언어처리 시스템들의 처리결과를 이용하고자 할 경우에는 별도의 복잡한 재개발과정을 거쳐 시스템 내에 그 시스템을 포함시켜 두어야만 한다. 이러한 정보는 전자사전을 통해 제공되며, 제공되는 정보의 양과 질에 따라 program의 성능도 영향을 많이 받는다[1].
3.1 웹 기반의 언어자원 객체화
2.2 Internet을 기반으로 한 분산 언어자원 통합 모델
통합정보사전 웹 기반의 언어자원 언어자원 객체화 / [1] 영남대학교, “심층 국어정보처리 품질관리 체계”, 한국과학기술원, 대용량 국어정보 심층처리 및 품질관리기술 개발 최종보고서, pp.56-68, 1998. [2] 이재성 외3, “텍스트 및 전자사전 관리시스템의 설계”, 한국정보과학회 & 한국인지과학회, 제8회 한국어 정보처리 학술대회 논문집, pp.408-414, 1996. [3] 한국과학기술원, “텍스트코퍼스 및 전자사전 관리시스템(TDMS)”, 과학기술처, 통합 국어정보베이스 최종보고서, pp.17-150, 1996. [4] 최병진 외3, “표준화를 위한 일반사전의 논리 구조”, 한국정보과학회&한국인지과학회, 제8회 한국어 정보처리 학술대회 논문집, pp.415-423, 1996. [5] 황도삼 외2, “자연언어처리”, 홍릉과학출판사, 1998. [6] 황도삼 외2, “자연언어이해”, 홍릉과학출판사, 1999. [7] 최용준, 황도삼, 최기선, “YDK : 한국어 통합정보사전 개발시스템의 설계 및 구현”, 한국정보과학회, 한국정보과학회 추계학술발표회논문집, 1998년 10월. [8] 최용준, 황도삼, 최기선, “YDK-Term : 한국어용언의 다국어 통합정보사전”, 한국인지과학회&한국정보과학
4. YDK2000의 설계 및 구현
[5] 황도삼 외2, “자연언어처리”, 홍릉과학출판사, 1998.
4.3 사전간의 자료교환 지원 환경
전자사전을 구축하는 일은 노동집약적이면서도 전문지식을 필요로 하기 때문에 개발과정이 길고, 개발한 사전은 지속적으로 단어가 추가될 뿐만 아니라, 때로는 사전의 구조 자체도 변경되게 된다된다. 이러한 과정을 거쳐 개발된다 하더라도 실제로 사용하기 위해서는 매우 큰 저장 공간과 고성능의 시스템이 필요하므로 여러 면에서 비효율적이다.
4.1 YDK2000의 설계
[3] 한국과학기술원, “텍스트코퍼스 및 전자사전 관리시스템(TDMS)”, 과학기술처, 통합 국어정보베이스 최종보고서, pp.17-150, 1996.
본 논문에서는 Internet의 기본 서비스인 웹(World Wide Web) 환경에서 분산된 언어자원들을 객체화시키는 방법을 제안한다.
2. 한국어 통합정보사전 개발 시스템
통합정보사전 웹 기반의 언어자원 언어자원 객체화
설명
[6] 황도삼 외2, “자연언어이해”, 홍릉과학출판사, 1999.
Download : .hwp( 16 )
3. 웹 기반의 언어자원 객체화 모델
2.3 YDK1
통합정보사전 웹 기반의 언어자원 언어자원 객체화 / [1] 영남대학교, “심층 국어정보처리 품질관리 체계”, 한국과학기술원, 대용량 국어정보 심층처리 및 품질관리기술 개발 최종보고서, pp.56-68, 1998.
4.4 결과 및 고찰
2.1 TDMS
3.2 언어자원 객체화 모듈





5. conclusion(결론) 본 논문에서는 각기 다른 장소에 다양한 형태로 분산되어 있는 여러가지 언어자원들을 웹 기반에서 객체화시키는 모델을 제안한다.
순서
레포트 > 사회과학계열
웹 기반의 언어자원 객체화에 근거한 사전 개발 시스템
자연언어처리 시스템들은 대개 많은 양의 문법정보, 의미정보, 용례 등을 필요로 한다. 제안한 모델의 적합성을 검증하기 위해 한국어 통합정보사전 개발시스템(YDK2000이라 부름.)을 설계하고 구현하였다. 제안한 모델의 적합성을 검증하기 위해 사전 개발 시스템 YDK2000를 설계하고 구현하였다. CORBA는 복잡한 재개발과정을 없애주는 특징이 있어 많이 이용되지만 별도의 미들웨어를 설치해야하며, 사용이 어렵다는 단점이 있다.