C# Class Lucene.Net.Analysis.Cn.ChineseTokenizer

Tokenize Chinese text as individual chinese chars.

The difference between ChineseTokenizer and CJKTokenizer is that they have different token parsing logic.

For example, if the Chinese text "C1C2C3C4" is to be indexed:

Therefore the index created by CJKTokenizer is much larger.

The problem is that when searching for C1, C1C2, C1C3, C4C2, C1C2C3 ... the ChineseTokenizer works, but the CJKTokenizer will not work.

Inheritance: Lucene.Net.Analysis.Tokenizer

Méthodes publiques

Méthode	Description
ChineseTokenizer ( AttributeFactory factory, TextReader @in ) : Lucene.Net.Analysis.Tokenattributes
ChineseTokenizer ( TextReader @in ) : Lucene.Net.Analysis.Tokenattributes
End ( ) : void
IncrementToken ( ) : bool
Reset ( ) : void

public ChineseTokenizer ( AttributeFactory factory, TextReader @in ) : Lucene.Net.Analysis.Tokenattributes
factory	AttributeFactory
@in	TextReader
Résultat	Lucene.Net.Analysis.Tokenattributes

public ChineseTokenizer ( TextReader @in ) : Lucene.Net.Analysis.Tokenattributes
@in	TextReader
Résultat	Lucene.Net.Analysis.Tokenattributes

public End ( ) : void
Résultat	void

public IncrementToken ( ) : bool
Résultat	bool

public Reset ( ) : void
Résultat	void