C# Класс Lucene.Net.Analysis.Th.ThaiWordBreaker

LUCENENET specific class to patch the behavior of the ICU BreakIterator. Corrects the breaking of words by finding transitions between Thai and non-Thai characters. This logic assumes that the Java BreakIterator also breaks up Thai numerals from Arabic numerals (1, 2, 3, etc.). That is, it assumes the first test below passes and the second test fails in Lucene (not attempted). ThaiAnalyzer analyzer = new ThaiAnalyzer(TEST_VERSION_CURRENT, CharArraySet.EMPTY_SET); AssertAnalyzesTo(analyzer, "๑๒๓456", new string[] { "๑๒๓", "456" }); AssertAnalyzesTo(analyzer, "๑๒๓456", new string[] { "๑๒๓456" });
Показать файл Открыть проект Примеры использования класса

Открытые методы

Метод Описание
Current ( ) : int
Next ( ) : int
SetText ( string text ) : void
ThaiWordBreaker ( BreakIterator wordBreaker ) : ICU4NET

Приватные методы

Метод Описание
GetNext ( ) : int

Описание методов

Current() публичный Метод

public Current ( ) : int
Результат int

Next() публичный Метод

public Next ( ) : int
Результат int

SetText() публичный Метод

public SetText ( string text ) : void
text string
Результат void

ThaiWordBreaker() публичный Метод

public ThaiWordBreaker ( BreakIterator wordBreaker ) : ICU4NET
wordBreaker BreakIterator
Результат ICU4NET