C# Класс Lucene.Net.Analysis.Th.ThaiTokenizer

Tokenizer that use BreakIterator to tokenize Thai text.

WARNING: this tokenizer may not be supported by all JREs. It is known to work with Sun/Oracle and Harmony JREs. If your application needs to be fully portable, consider using ICUTokenizer instead, which uses an ICU Thai BreakIterator that will always be available.

Наследование: Lucene.Net.Analysis.Util.SegmentingTokenizerBase
Показать файл Открыть проект Примеры использования класса

Открытые свойства

Свойство Тип Описание
DBBI_AVAILABLE bool

Открытые методы

Метод Описание
ThaiTokenizer ( AttributeFactory factory, TextReader reader ) : ICU4NET

Creates a new ThaiTokenizer, supplying the AttributeFactory

ThaiTokenizer ( TextReader reader ) : ICU4NET

Creates a new ThaiTokenizer

Защищенные методы

Метод Описание
IncrementWord ( ) : bool
SetNextSentence ( int sentenceStart, int sentenceEnd ) : void

Приватные методы

Метод Описание
ThaiTokenizer ( ) : ICU4NET

Описание методов

IncrementWord() защищенный Метод

protected IncrementWord ( ) : bool
Результат bool

SetNextSentence() защищенный Метод

protected SetNextSentence ( int sentenceStart, int sentenceEnd ) : void
sentenceStart int
sentenceEnd int
Результат void

ThaiTokenizer() публичный Метод

Creates a new ThaiTokenizer, supplying the AttributeFactory
public ThaiTokenizer ( AttributeFactory factory, TextReader reader ) : ICU4NET
factory AttributeFactory
reader System.IO.TextReader
Результат ICU4NET

ThaiTokenizer() публичный Метод

Creates a new ThaiTokenizer
public ThaiTokenizer ( TextReader reader ) : ICU4NET
reader System.IO.TextReader
Результат ICU4NET

Описание свойств

DBBI_AVAILABLE публичное статическое свойство

True if the JRE supports a working dictionary-based breakiterator for Thai. If this is false, this tokenizer will not work at all!
public static bool DBBI_AVAILABLE
Результат bool