C# Класс Lucene.Net.Analysis.Cn.ChineseFilter

A {@link TokenFilter} with a stop word table.
  • Numeric tokens are removed.
  • English tokens must be larger than 1 char.
  • One Chinese char as one Chinese word.
TO DO:
  1. Add Chinese stop words, such as \ue400
  2. Dictionary based Chinese word extraction
  3. Intelligent Chinese word extraction
Наследование: Lucene.Net.Analysis.TokenFilter
Показать файл Открыть проект Примеры использования класса

Открытые свойства

Свойство Тип Описание
STOP_WORDS string[]

Открытые методы

Метод Описание
ChineseFilter ( TokenStream @in ) : Lucene.Net.Analysis.Tokenattributes
IncrementToken ( ) : bool

Описание методов

ChineseFilter() публичный Метод

public ChineseFilter ( TokenStream @in ) : Lucene.Net.Analysis.Tokenattributes
@in Lucene.Net.Analysis.TokenStream
Результат Lucene.Net.Analysis.Tokenattributes

IncrementToken() публичный Метод

public IncrementToken ( ) : bool
Результат bool

Описание свойств

STOP_WORDS публичное статическое свойство

public static string[] STOP_WORDS
Результат string[]