중소기업 기술혁신 개발사업 - 계층적 어휘 연관 정보를 이용한 실시간 검색 결과의 클러스터링

개발 과제명 계층적 어휘 연관 정보를 이용한 실시간 검색 결과의 클러스터링

개발 목표 사용자가 정보 검색 시스템을 보다 유용하게 사용할 수 있도록 계층적 어휘 연관 정보를 이용한 클러스터링된 검색 결과를 사용자에게 제시한다.

개발 내용 기존의 기술에서 처리할 수 없었던 한국어의 언어적 특성을 반영하고 언어적 연관관계를 정용한 검색결과 클러스터링 기술을 개발.


세부 개발 내용

1. 단서 추출 및 Suffix tree에 기반한 클러스터링 기술 개발
2. 클러스터의 명칭부여 방법 개발
3. 언어 정보 사전을 반영한 정보 검색 시스템 개발
4. 클러스터링 반영을 위한 검색 시스템 인터페이스 구축
5. 실시간 검색 결과 클러스터링을 적용한 정보 검색 시스템 프로토타입 구축
6. 클러스터링을 이용한 검색 결과의 재순위화 방법 개발
7. 사이트의 클러스터링 방법 개발

사업수행기간 - 2004.3.1 ~ 2005.2.28


(주)나라인포테크, SBS와 1월 12일 계약

SBS에 "한글 맞춤법 검사기 컴포넌트 공급
2005년 2월 1일부터 사용


지능형 전자상거래와 시맨틱웹을 위한 온톨로지 저작도구 및 검색 시스템 개발

한국산업기술평가원
사업수행기간 - 2003.8.1 ~ 2005.7.31


인터넷에 기반한 능동적 '우리말 바로쓰기'통합 지원 시스템의 개발
Implementation of a Dynamically Integrated Korean Writing Support System based on Internet

정보통신산업기술개발사업(정보통신부)
총개발기간: 2001. 5. 1 ~ 2003. 4. 30 (24개월)

- 인터넷 응용 시스템(전자우편, 홈페이지, 채팅, 게시판 포함)에서 활용할 수 있는 한국어 맞춤법/문법 검사기의 제공
- 인터넷을 이용한 우리말 맞춤법/문법에 대한 학습(논술 시험 준비 등 포함)을 통한 바른 우리말을 쓰는 환경조성 및 교육 비용 절감
- 한국어 정보 검색 시스템, 한국어 기반 인터넷 에이전트 등의 효율 향상(오류단어, 사투리와 은어를 표준말로 교정)
- 전문용어사전을 공동 개발하여 인터넷에서 활용하고 그 결과물을 한국어 전산 처리 자료로 사용 - 인터넷 응용 시스템이 한글/한국어 관련 모듈(한글코드변환기, 한글-한자 변환기)을 공유하여 활용함으로써 개발 비용 감소와 표준화
- 일반 인터넷 사용자는 글쓰기 시스템(일반용 맞춤법/문법 검사 ActiveX Component)을 인터넷에서 받아서 사용하며, 한국어 교육 시스템과 연계하여 오류 학습 기능
- 인터넷 무료 게시판/방명록 서비스 제공자는 맞춤법/문법 검사기(기업용 맞춤법/문법검사기 ActiveX component)를 자사 제품에 결합하여 사용


인터넷에 기반한 능동적 '우리말 바로쓰기'통합 지원 시스템의 개발에 관한 발표

'우리말 바로쓰기'시스템의 개괄적 구성
기술동향
세부수행방법
시장진입 장애요인 및 해소방안
연구결과의 활용성
매출 정망 및 사업화 계획에 관한 보고


작성일: 2001년 02월 27일


웹기반의 멀티미디어 데이터를 위한 검색 시스템 개발

산업기반기술개발사업(산업자원부)
총개발기간 : 2000. 8. 1 ∼2001. 7. 31 (12개월)

급증하는 웹 문서 속에서 일반 사용자가 원하는 문서를 쉽게 검색할 수 있는
①자연어 검색 시스템과 이를 위한
②의미 관계 사전과
③collocation 사전의 구축, 이미지, 동영상, 음성 등의 멀티미디어 데이터를 검색하는
④멀티미디어 데이터 검색 시스템의 개발
⑤XML, SGML 등을 이용하여 작성된 구조화된 문서의 검색을 위한 색인어 사전 구조의 개발
⑥웹 문서 중 표 데이터의 개념화 사전 구축을 연구개발 목표로 한다.


개념에 기반한 한국어 문서의 색인 기법

우수신기술지정·지원사업(정보통신연구진흥원)
총개발기간 : 2000. 8. 1 ∼ 2001. 7. 31 (12개월)

현재 널리 쓰이는 형태소 분석과 태깅(tagging)에 기반한 색인 기법을 발전시켜 의존관계를 바탕으로 색인어 간의 관계정보를 추출하여 개념화하고, 이 개념화에 바탕하여 색인하는 기법을 제시한다.
중요 개발 기술은 다음과 같다.
- 인터넷 문서 중 한국어 문서 단계적 개념화
- 인터넷 문서 중 표의 개념화
- 인간에 의한 개념망(시소러스)의 구축


CNN 방송자막뉴스 정치,경제 문장의 대용량 영한 번역 패턴 구축

한국전자통신연구원
총개발기간 : 2000. 5. ∼ 2000. 10. 8. (5개월)

- ETRI가 제공한 4만 문장에서 문틀 유형 15,000개를 추출한다.
- ETRI 기계 번역 시스템의 실험 과정에서 언어학적으로 추가가 필요하다고 예측되는 문틀 유형을 4,000개 구축한다.
- 본 회사의 사장이 자연어 처리 연구 과정에서 구축한 태깅 기법을 활용하여 1,000개의 문틀 구조를 구축한다. (총 문틀 구조 20,000 개 구축)


정보통신 우수신기술 지정

정보통신부는 통신기술, 전파방송기술, 반도체·부품, 정보기술 등 4개분야에서 발굴한 20개 신기술을 정보통신 우수 신기술로 지정, 7월27일 발표했다.  


작성일: 2000년 07월 27일


신설법인 현황

작성일: 2000년 05월 19일

 

 

 

 

Copyright ⓒ2000 Nara info tech. co,. ltd. All rights reserved.