21세기 세종계획 성과발표회 열려
스크롤 이동 상태바
21세기 세종계획 성과발표회 열려
이 기사를 공유합니다
기계인식 첨단 전자사전·2억어절규모 말뭉치 등 개발

1998년부터 2007년까지 200여 명의 연구진이 참여한 ‘21세기 세종계획’이 최근 완료됐다.

국립국어원(원장 이상규)은 11일 국립중앙박물관 대강당에서 21세기 세종계획 사업성과발표회를 열었다.

1998년 시작된 21세기 세종계획은 올해까지 10년간 △국어 연구 기반 마련 △우리말 정보화 △우리말 세계화 △우리말 표준화라는 4대 목표 하에 추진된 사업이다.

세계 최대 수준의 말뭉치를 구축하고 컴퓨터가 인식할 수 있는 전자사전을 개발한 것이 가장 두드러진 성과다. 그 외에도 △한민족 언어 정보화 △우리말 정보화·세계화를 위한 각종 프로그램 개발 △우리말 표준화를 위한 전문용어 정비 △문자코드 표준화사업 등도 병행돼 일정한 성과를 올렸다.

^^^▲ 국립국어원은 이번 세종계획의 성과를 산업적으로 활용할 수 있는 2단계 사업을 계획하고 있다. 사진은 이제까지의 성과물이 축적된 21세기 세종계획사이트 화면. 말뭉치 용례와 언어정보화 용어 검색이 기본으로 제공되고 있다.^^^
말뭉치는 국민 전체의 언어·문화생활과 기술·학문 발전을 위해 신문, 잡지, 책 등 다양한 자료를 컴퓨터에 입력해 필요한 자료를 검색할 수 있도록 컴퓨터에 저장되는 대규모 언어자료프로그램.

이번 세종계획에서 구축된 말뭉치는 소설책 4,000권 분량인 2억어절이나 된다. 또한 검색 프로그램 ‘한마루’로 단어검색이 가능하도록 했다.

외국의 경우도 대규모 말뭉치 구축사업은 완료됐거나 진행되고 있다. 영국은 1991년부터 1994년까지 1억 어절의 말뭉치를 구축했고, 중국은 2000년부터 중·영, 중·일 병렬 말뭉치를 베이징대학교·베이징외국어대학교를 중심으로 구축하고 있다.

일본은 1986년부터 1994년까지 단어 위주의 말뭉치를 구축했다. 또 지난 2006년부터 2011년까지 1,000만 단어를 목표로 일본 국립국어연구소가 ‘일본어 균형 말뭉치’ 구축을 시작했다.

기계가 인식할 수 있는 첨단 전자사전인 ‘세종전자사전’도 개발됐다.

‘세종전자사전’은 60만 어휘에 달하는 대규모의 범용 전자 사전으로 특정 유형이나 영역의 기계 처리 작업에 국한되지 않고 △정보 검색 △텍스트 분석과 산출 △자동번역 △다국어 사전 구축 △인쇄 사전 구축 △한국어 교육 △순수 연구 등에 두루 활용될 수 있다.

향후 인공지능 환경에도 유연하게 적용될 수 있도록 설계됐으며 현재 21세기 세종계획 사이트(www.sejong.or.kr)에서 제공되고 있다.

한편 국립국어원측은 지난 7일 “그동안 축적한 결과물을 산업적으로 활용할 수 있는 2단계 사업을 계획하고 있다”고 밝힌 바 있다.

이 기사를 공유합니다
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
메인페이지가 로드 됐습니다.
기획특집
가장많이본 기사
칼럼/수첩/발언대/인터뷰
방송뉴스 포토뉴스
오피니언  
연재코너  
지역뉴스
공지사항
손상윤의 나사랑과 정의를···
뉴스타운TV 기사보기