C# Класс NBoilerpipe.Filters.Heuristics.DocumentTitleMatchClassifier

Marks NBoilerpipe.Document.TextBlock s which contain parts of the HTML <TITLE> tag, using some heuristics which are quite specific to the news domain.
Наследование: BoilerpipeFilter
Показать файл Открыть проект

Открытые методы

Метод Описание
DocumentTitleMatchClassifier ( string title ) : System.Collections.Generic
GetPotentialTitles ( ) : ICollection
Process ( NBoilerpipe.Document.TextDocument doc ) : bool

Приватные методы

Метод Описание
GetLongestPart ( string title, string pattern ) : string

Описание методов

DocumentTitleMatchClassifier() публичный Метод

public DocumentTitleMatchClassifier ( string title ) : System.Collections.Generic
title string
Результат System.Collections.Generic

GetPotentialTitles() публичный Метод

public GetPotentialTitles ( ) : ICollection
Результат ICollection

Process() публичный Метод

public Process ( NBoilerpipe.Document.TextDocument doc ) : bool
doc NBoilerpipe.Document.TextDocument
Результат bool