유돌이

calendar

1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

Notice

2009. 1. 5. 18:05 비법전수

1. 장형석님의 PHP 형태소 분석기 0.52


  • Public Domain
  • PHP로 만들어졌다.
  • EUC-KR 문자셋
  • 상당히 간단하다.

2. KTS

확률을 기반으로 하고있는 이상호님의 KTS
  • GPL
  • 사전, 조사,어미, 등등
  • 이성진코드 기반.
  • EUC-KR 지원
  • 문서가 비교적 잘 만들어져있다.

3. S C Lee 님의 sma4

  • GPL
  • C언어
  • 사전, 조사, 어미, 관형사사전
  • EUC-KR 문자셋
  • 송재경님의 조합 한글 소스 바탕.
 
4. 초고속 한국어 형태소 분석기 MACH 1.0

Shim, Kwangseob
School of Computer Science and Engineering
Sungshin Women's University
Seoul 151-742, KOREA
shim at sungshin.ac.kr
 
5. KLT: Korean Language Technology -- (구)HAM: Hangul Analysis Module

  • [Down 가능] 윈도95/98/NT/2000용
  • [Down 가능] 32비트 리눅스용
  • 압축파일에 포함되어 있는 README.TXT를 꼭 읽으세요.(구버전 라이브러리를 교체할 경우에, 반드시 header/runmode.h를 교체하고 실행파일을 다시 만들어야 함)

  • 연구용 형태소 분석기는 윈도와 리눅스용만 제공합니다.
  • Sun Solaris, HP Unix, IBM AIX, Free BSD, Digital Unix 등 기타 플랫폼에 대한 연구용 버전은 제공하지 않으며, 정식 사용권을 얻어야 합니다.

  • 특징 1. 분석 정확도가 매우 높아졌음 -- 특히, 미등록어, 고유명사 등
  • 특징 2. 추출되는 용어의 개수가 줄었음 -- 불필요한 용어 추출 방지

  • 실행방법(리눅스, 유닉스 계열) -- "$ index -2 inputfile.txt", "$ indexT -2 inputfile.txt", OR "$ index -2"(표준 입출력)
  • 실행방법(윈도용) -- 1) indexWin.exe(윈도창) 2) DOS창에서 "C> index -2 inputfile.txt"(linux/unix용과 동일)
  • linux에서는 압축파일의 API라는 디렉토리에서 make하면 EXE 디렉토리에 실행파일이 생성됩니다.
  • KLT version 2.1.0f는 연구 및 실험용으로 2009년 12월까지만 사용할 수 있으며, 분석결과에 대한 기능상의 제약이 있을 수 있습니다.(어떤 경우에도 저작권자의 허락없이는 직접 혹은 간접적으로 상업적인 목적으로 활용할 수 없습니다) 

  • '비법전수' 카테고리의 다른 글

    컴퓨터 성능 확인.  (0) 2009.05.26
    컴퓨터 성능 확인  (0) 2009.05.19
    MS툴 무료 제공 및 설치  (0) 2008.12.20
    sticky tag를 제거 방법.  (0) 2008.12.20
    우분투 동영상 관련 설정  (0) 2008.12.20
    posted by 유돌이