C# 클래스 Lucene.Net.Analysis.Th.ThaiWordBreaker

LUCENENET specific class to patch the behavior of the ICU BreakIterator. Corrects the breaking of words by finding transitions between Thai and non-Thai characters. This logic assumes that the Java BreakIterator also breaks up Thai numerals from Arabic numerals (1, 2, 3, etc.). That is, it assumes the first test below passes and the second test fails in Lucene (not attempted). ThaiAnalyzer analyzer = new ThaiAnalyzer(TEST_VERSION_CURRENT, CharArraySet.EMPTY_SET); AssertAnalyzesTo(analyzer, "๑๒๓456", new string[] { "๑๒๓", "456" }); AssertAnalyzesTo(analyzer, "๑๒๓456", new string[] { "๑๒๓456" });
파일 보기 프로젝트 열기: apache/lucenenet 1 사용 예제들

공개 메소드들

메소드 설명
Current ( ) : int
Next ( ) : int
SetText ( string text ) : void
ThaiWordBreaker ( BreakIterator wordBreaker ) : ICU4NET

비공개 메소드들

메소드 설명
GetNext ( ) : int

메소드 상세

Current() 공개 메소드

public Current ( ) : int
리턴 int

Next() 공개 메소드

public Next ( ) : int
리턴 int

SetText() 공개 메소드

public SetText ( string text ) : void
text string
리턴 void

ThaiWordBreaker() 공개 메소드

public ThaiWordBreaker ( BreakIterator wordBreaker ) : ICU4NET
wordBreaker BreakIterator
리턴 ICU4NET