C# Класс Lucene.Net.Analysis.Nl.DutchAnalyzer

Analyzer for Dutch language. Supports an external list of stopwords (words that will not be indexed at all), an external list of exclusions (word that will not be stemmed, but indexed) and an external list of word-stem pairs that overrule the algorithm (dictionary stemming). A default set of stopwords is used unless an alternative list is specified, the exclusion list is empty by default. As start for the Analyzer the German Analyzer was used. The stemming algorithm implemented can be found at $Id: DutchAnalyzer.java,v 1.1 2004/03/09 14:55:08 otis Exp $
Наследование: Analyzer
Показать файл Открыть проект Примеры использования класса

Открытые свойства

Свойство Тип Описание
DUTCH_STOP_WORDS String[]

Открытые методы

Метод Описание
DutchAnalyzer ( Lucene.Net.Util.Version matchVersion ) : System
DutchAnalyzer ( Lucene.Net.Util.Version matchVersion, FileInfo stopwords ) : System
DutchAnalyzer ( Lucene.Net.Util.Version matchVersion, HashSet stopwords ) : System
DutchAnalyzer ( Lucene.Net.Util.Version matchVersion, ISet stopwords ) : System
DutchAnalyzer ( Lucene.Net.Util.Version matchVersion, ISet stopwords, ISet stemExclusionTable ) : System
ReusableTokenStream ( String fieldName, TextReader reader ) : TokenStream
SetStemDictionary ( FileInfo stemdictFile ) : void
SetStemExclusionTable ( ) : void
SetStemExclusionTable ( FileInfo exclusionlist ) : void
SetStemExclusionTable ( ISet exclusionlist ) : void
TokenStream ( String fieldName, TextReader reader ) : TokenStream
getDefaultStopSet ( ) : ISet

Описание методов

DutchAnalyzer() публичный Метод

public DutchAnalyzer ( Lucene.Net.Util.Version matchVersion ) : System
matchVersion Lucene.Net.Util.Version
Результат System

DutchAnalyzer() публичный Метод

public DutchAnalyzer ( Lucene.Net.Util.Version matchVersion, FileInfo stopwords ) : System
matchVersion Lucene.Net.Util.Version
stopwords System.IO.FileInfo
Результат System

DutchAnalyzer() публичный Метод

public DutchAnalyzer ( Lucene.Net.Util.Version matchVersion, HashSet stopwords ) : System
matchVersion Lucene.Net.Util.Version
stopwords HashSet
Результат System

DutchAnalyzer() публичный Метод

public DutchAnalyzer ( Lucene.Net.Util.Version matchVersion, ISet stopwords ) : System
matchVersion Lucene.Net.Util.Version
stopwords ISet
Результат System

DutchAnalyzer() публичный Метод

public DutchAnalyzer ( Lucene.Net.Util.Version matchVersion, ISet stopwords, ISet stemExclusionTable ) : System
matchVersion Lucene.Net.Util.Version
stopwords ISet
stemExclusionTable ISet
Результат System

ReusableTokenStream() публичный Метод

public ReusableTokenStream ( String fieldName, TextReader reader ) : TokenStream
fieldName String
reader System.IO.TextReader
Результат TokenStream

SetStemDictionary() публичный Метод

public SetStemDictionary ( FileInfo stemdictFile ) : void
stemdictFile System.IO.FileInfo
Результат void

SetStemExclusionTable() публичный Метод

public SetStemExclusionTable ( ) : void
Результат void

SetStemExclusionTable() публичный Метод

public SetStemExclusionTable ( FileInfo exclusionlist ) : void
exclusionlist System.IO.FileInfo
Результат void

SetStemExclusionTable() публичный Метод

public SetStemExclusionTable ( ISet exclusionlist ) : void
exclusionlist ISet
Результат void

TokenStream() публичный Метод

public TokenStream ( String fieldName, TextReader reader ) : TokenStream
fieldName String
reader System.IO.TextReader
Результат TokenStream

getDefaultStopSet() публичный статический Метод

public static getDefaultStopSet ( ) : ISet
Результат ISet

Описание свойств

DUTCH_STOP_WORDS публичное статическое свойство

public static String[] DUTCH_STOP_WORDS
Результат String[]