C# Класс NBoilerpipe.Filters.English.NumWordsRulesClassifier

Classifies NBoilerpipe.Document.TextBlock s as content/not-content through rules that have been determined using the C4.8 machine learning algorithm, as described in the paper "Boilerplate Detection using Shallow Text Features" (WSDM 2010), particularly using number of words per block and link density per block.
Наследование: BoilerpipeFilter
Показать файл Открыть проект

Открытые свойства

Свойство Тип Описание
INSTANCE NumWordsRulesClassifier

Открытые методы

Метод Описание
GetInstance ( ) : NumWordsRulesClassifier

Returns the singleton instance for RulebasedBoilerpipeClassifier.

Returns the singleton instance for RulebasedBoilerpipeClassifier.

Process ( NBoilerpipe.Document.TextDocument doc ) : bool

Защищенные методы

Метод Описание
Classify ( TextBlock prev, TextBlock curr, TextBlock next ) : bool

Описание методов

Classify() защищенный Метод

protected Classify ( TextBlock prev, TextBlock curr, TextBlock next ) : bool
prev NBoilerpipe.Document.TextBlock
curr NBoilerpipe.Document.TextBlock
next NBoilerpipe.Document.TextBlock
Результат bool

GetInstance() публичный статический Метод

Returns the singleton instance for RulebasedBoilerpipeClassifier.
Returns the singleton instance for RulebasedBoilerpipeClassifier.
public static GetInstance ( ) : NumWordsRulesClassifier
Результат NumWordsRulesClassifier

Process() публичный Метод

public Process ( NBoilerpipe.Document.TextDocument doc ) : bool
doc NBoilerpipe.Document.TextDocument
Результат bool

Описание свойств

INSTANCE публичное статическое свойство

public static NumWordsRulesClassifier,NBoilerpipe.Filters.English INSTANCE
Результат NumWordsRulesClassifier