C# 클래스 Lucene.Net.Analysis.Cn.ChineseFilter

A {@link TokenFilter} with a stop word table.
  • Numeric tokens are removed.
  • English tokens must be larger than 1 char.
  • One Chinese char as one Chinese word.
TO DO:
  1. Add Chinese stop words, such as \ue400
  2. Dictionary based Chinese word extraction
  3. Intelligent Chinese word extraction
상속: Lucene.Net.Analysis.TokenFilter
파일 보기 프로젝트 열기: apache/lucenenet 1 사용 예제들

공개 프로퍼티들

프로퍼티 타입 설명
STOP_WORDS string[]

공개 메소드들

메소드 설명
ChineseFilter ( TokenStream @in ) : Lucene.Net.Analysis.Tokenattributes
IncrementToken ( ) : bool

메소드 상세

ChineseFilter() 공개 메소드

public ChineseFilter ( TokenStream @in ) : Lucene.Net.Analysis.Tokenattributes
@in Lucene.Net.Analysis.TokenStream
리턴 Lucene.Net.Analysis.Tokenattributes

IncrementToken() 공개 메소드

public IncrementToken ( ) : bool
리턴 bool

프로퍼티 상세

STOP_WORDS 공개적으로 정적으로 프로퍼티

public static string[] STOP_WORDS
리턴 string[]