C# Класс HtmlParserSharp.Core.Tokenizer

Показать файл Открыть проект Примеры использования класса

Защищенные свойства (Protected)

Свойство Тип Описание
ampersandLocation Locator
attributeName AttributeName
confident bool
cstart int
endTag bool
endTagExpectation ElementName
html4 bool
index int
lastCR bool
stateSave TokenizerState
value int

Открытые методы

Метод Описание
BecomeConfident ( ) : void
End ( ) : void
Eof ( ) : void
Err ( string message ) : void
ErrTreeBuilder ( string message ) : void
Fatal ( string message ) : void
InitializeWithoutStarting ( ) : void
InternalEncodingDeclaration ( string internalCharset ) : bool
LoadState ( Tokenizer other ) : void
NotifyAboutMetaBoundary ( ) : void
RequestSuspension ( ) : void
ResetToDataState ( ) : void
SetStateAndEndTagExpectation ( TokenizerState specialTokenizerState, ElementName endTagExpectation ) : void
SetStateAndEndTagExpectation ( TokenizerState specialTokenizerState, [ endTagExpectation ) : void
SetTransitionBaseOffset ( int offset ) : void

Sets an offset to be added to the position reported to TransitionHandler.

Start ( ) : void
TokenizeBuffer ( UTF16Buffer buffer ) : bool
Tokenizer ( ITokenHandler tokenHandler ) : System
Tokenizer ( ITokenHandler tokenHandler, bool newAttributesEachTime ) : System
Warn ( string message ) : void

Защищенные методы

Метод Описание
ErrAstralNonCharacter ( int ch ) : void
ErrAttributeValueMissing ( ) : void
ErrBadCharAfterLt ( char c ) : void
ErrBadCharBeforeAttributeNameOrNull ( char c ) : void
ErrBogusComment ( ) : void
ErrBogusDoctype ( ) : void
ErrCharRefLacksSemicolon ( ) : void
ErrConsecutiveHyphens ( ) : void
ErrDuplicateAttribute ( ) : void
ErrEofAfterLt ( ) : void
ErrEofInAttributeName ( ) : void
ErrEofInAttributeValue ( ) : void
ErrEofInComment ( ) : void
ErrEofInDoctype ( ) : void
ErrEofInEndTag ( ) : void
ErrEofInPublicId ( ) : void
ErrEofInSystemId ( ) : void
ErrEofInTagName ( ) : void
ErrEofWithoutGt ( ) : void
ErrEqualsSignBeforeAttributeName ( ) : void
ErrExpectedPublicId ( ) : void
ErrExpectedSystemId ( ) : void
ErrGarbageAfterLtSlash ( ) : void
ErrGtInPublicId ( ) : void
ErrGtInSystemId ( ) : void
ErrHtml4LtSlashInRcdata ( char folded ) : void
ErrHtml4NonNameInUnquotedAttribute ( char c ) : void
ErrHtml4XmlVoidSyntax ( ) : void
ErrHyphenHyphenBang ( ) : void
ErrLtGt ( ) : void
ErrLtOrEqualsOrGraveInUnquotedAttributeOrNull ( char c ) : void
ErrLtSlashGt ( ) : void
ErrMissingSpaceBeforeDoctypeName ( ) : void
ErrNamelessDoctype ( ) : void
ErrNcrControlChar ( char ch ) : char
ErrNcrControlChar ( ) : void
ErrNcrCr ( ) : void
ErrNcrInC1Range ( ) : void
ErrNcrNonCharacter ( char ch ) : char
ErrNcrOutOfRange ( ) : void
ErrNcrSurrogate ( ) : void
ErrNcrUnassigned ( ) : void
ErrNcrZero ( ) : void
ErrNoDigitsInNCR ( ) : void
ErrNoNamedCharacterMatch ( ) : void
ErrNoSpaceBetweenAttributes ( ) : void
ErrNoSpaceBetweenDoctypePublicKeywordAndQuote ( ) : void
ErrNoSpaceBetweenDoctypeSystemKeywordAndQuote ( ) : void
ErrNoSpaceBetweenPublicAndSystemIds ( ) : void
ErrNotSemicolonTerminated ( ) : void
ErrPrematureEndOfComment ( ) : void
ErrProcessingInstruction ( ) : void
ErrQuoteBeforeAttributeName ( char c ) : void
ErrQuoteOrLtInAttributeNameOrNull ( char c ) : void
ErrSlashNotFollowedByGt ( ) : void
ErrUnescapedAmpersandInterpretedAsCharacterReference ( ) : void
ErrUnquotedAttributeValOrNull ( char c ) : void
ErrWarnLtSlashInRcdata ( ) : void
FlushChars ( char buf, int pos ) : void

Flushes coalesced character tokens.

MaybeErrAttributesOnEndTag ( HtmlAttributes attrs ) : void
MaybeErrSlashInEndTag ( bool selfClosing ) : void
MaybeWarnPrivateUse ( char ch ) : void
MaybeWarnPrivateUseAstral ( ) : void
NoteAttributeWithoutValue ( ) : void
NoteUnquotedAttributeValue ( ) : void
SilentCarriageReturn ( ) : void
SilentLineFeed ( ) : void
StartErrorReporting ( ) : void

Приватные методы

Метод Описание
AddAttributeWithValue ( ) : void
AddAttributeWithoutValue ( ) : void
AdjustDoubleHyphenAndAppendToLongStrBufAndErr ( char c ) : void
AdjustDoubleHyphenAndAppendToLongStrBufCarriageReturn ( ) : void
AdjustDoubleHyphenAndAppendToLongStrBufLineFeed ( ) : void
AppendLongStrBuf ( char c ) : void
AppendLongStrBuf ( char buffer, int offset, int length ) : void
AppendLongStrBufCarriageReturn ( ) : void
AppendLongStrBufLineFeed ( ) : void
AppendSecondHyphenToBogusComment ( ) : void
AppendStrBuf ( char c ) : void
AppendStrBufToLongStrBuf ( ) : void
AttributeNameComplete ( ) : void
BogusDoctype ( ) : void
BogusDoctypeWithoutQuirks ( ) : void
ClearLongStrBuf ( ) : void
ClearLongStrBufAndAppend ( char c ) : void
ClearStrBuf ( ) : void
ClearStrBufAndAppend ( char c ) : void
EmitCarriageReturn ( char buf, int pos ) : void
EmitComment ( int provisionalHyphens, int pos ) : void

Emits the current comment token.

EmitCurrentTagToken ( bool selfClosing, int pos ) : TokenizerState
EmitDoctypeToken ( int pos ) : void
EmitOrAppendOne ( char val, TokenizerState returnState ) : void
EmitOrAppendStrBuf ( TokenizerState returnState ) : void
EmitOrAppendTwo ( char val, TokenizerState returnState ) : void
EmitPlaintextReplacementCharacter ( char buf, int pos ) : void
EmitReplacementCharacter ( char buf, int pos ) : void
EmitStrBuf ( ) : void
EmptyAttributes ( ) : HtmlAttributes
EndTagExpectationToArray ( ) : void
HandleNcrValue ( TokenizerState returnState ) : void
InitDoctypeFields ( ) : void
LongStrBufToString ( ) : string
MaybeAppendSpaceToBogusComment ( ) : void
NewAsciiLowerCaseStringFromString ( String str ) : String
ResetAttributes ( ) : void
SetAdditionalAndRememberAmpersandLocation ( char add ) : void
StateLoop ( TokenizerState state, char c, int pos, char buf, bool reconsume, TokenizerState returnState, int endPos ) : int
StrBufToDoctypeName ( ) : void
StrBufToElementNameString ( ) : void
TurnOnAdditionalHtml4Errors ( ) : void

Описание методов

BecomeConfident() публичный Метод

public BecomeConfident ( ) : void
Результат void

End() публичный Метод

public End ( ) : void
Результат void

Eof() публичный Метод

public Eof ( ) : void
Результат void

Err() публичный Метод

public Err ( string message ) : void
message string
Результат void

ErrAstralNonCharacter() защищенный Метод

protected ErrAstralNonCharacter ( int ch ) : void
ch int
Результат void

ErrAttributeValueMissing() защищенный Метод

protected ErrAttributeValueMissing ( ) : void
Результат void

ErrBadCharAfterLt() защищенный Метод

protected ErrBadCharAfterLt ( char c ) : void
c char
Результат void

ErrBadCharBeforeAttributeNameOrNull() защищенный Метод

protected ErrBadCharBeforeAttributeNameOrNull ( char c ) : void
c char
Результат void

ErrBogusComment() защищенный Метод

protected ErrBogusComment ( ) : void
Результат void

ErrBogusDoctype() защищенный Метод

protected ErrBogusDoctype ( ) : void
Результат void

ErrCharRefLacksSemicolon() защищенный Метод

protected ErrCharRefLacksSemicolon ( ) : void
Результат void

ErrConsecutiveHyphens() защищенный Метод

protected ErrConsecutiveHyphens ( ) : void
Результат void

ErrDuplicateAttribute() защищенный Метод

protected ErrDuplicateAttribute ( ) : void
Результат void

ErrEofAfterLt() защищенный Метод

protected ErrEofAfterLt ( ) : void
Результат void

ErrEofInAttributeName() защищенный Метод

protected ErrEofInAttributeName ( ) : void
Результат void

ErrEofInAttributeValue() защищенный Метод

protected ErrEofInAttributeValue ( ) : void
Результат void

ErrEofInComment() защищенный Метод

protected ErrEofInComment ( ) : void
Результат void

ErrEofInDoctype() защищенный Метод

protected ErrEofInDoctype ( ) : void
Результат void

ErrEofInEndTag() защищенный Метод

protected ErrEofInEndTag ( ) : void
Результат void

ErrEofInPublicId() защищенный Метод

protected ErrEofInPublicId ( ) : void
Результат void

ErrEofInSystemId() защищенный Метод

protected ErrEofInSystemId ( ) : void
Результат void

ErrEofInTagName() защищенный Метод

protected ErrEofInTagName ( ) : void
Результат void

ErrEofWithoutGt() защищенный Метод

protected ErrEofWithoutGt ( ) : void
Результат void

ErrEqualsSignBeforeAttributeName() защищенный Метод

protected ErrEqualsSignBeforeAttributeName ( ) : void
Результат void

ErrExpectedPublicId() защищенный Метод

protected ErrExpectedPublicId ( ) : void
Результат void

ErrExpectedSystemId() защищенный Метод

protected ErrExpectedSystemId ( ) : void
Результат void

ErrGarbageAfterLtSlash() защищенный Метод

protected ErrGarbageAfterLtSlash ( ) : void
Результат void

ErrGtInPublicId() защищенный Метод

protected ErrGtInPublicId ( ) : void
Результат void

ErrGtInSystemId() защищенный Метод

protected ErrGtInSystemId ( ) : void
Результат void

ErrHtml4LtSlashInRcdata() защищенный Метод

protected ErrHtml4LtSlashInRcdata ( char folded ) : void
folded char
Результат void

ErrHtml4NonNameInUnquotedAttribute() защищенный Метод

protected ErrHtml4NonNameInUnquotedAttribute ( char c ) : void
c char
Результат void

ErrHtml4XmlVoidSyntax() защищенный Метод

protected ErrHtml4XmlVoidSyntax ( ) : void
Результат void

ErrHyphenHyphenBang() защищенный Метод

protected ErrHyphenHyphenBang ( ) : void
Результат void

ErrLtGt() защищенный Метод

protected ErrLtGt ( ) : void
Результат void

ErrLtOrEqualsOrGraveInUnquotedAttributeOrNull() защищенный Метод

protected ErrLtOrEqualsOrGraveInUnquotedAttributeOrNull ( char c ) : void
c char
Результат void

ErrLtSlashGt() защищенный Метод

protected ErrLtSlashGt ( ) : void
Результат void

ErrMissingSpaceBeforeDoctypeName() защищенный Метод

protected ErrMissingSpaceBeforeDoctypeName ( ) : void
Результат void

ErrNamelessDoctype() защищенный Метод

protected ErrNamelessDoctype ( ) : void
Результат void

ErrNcrControlChar() защищенный Метод

protected ErrNcrControlChar ( char ch ) : char
ch char
Результат char

ErrNcrControlChar() защищенный Метод

protected ErrNcrControlChar ( ) : void
Результат void

ErrNcrCr() защищенный Метод

protected ErrNcrCr ( ) : void
Результат void

ErrNcrInC1Range() защищенный Метод

protected ErrNcrInC1Range ( ) : void
Результат void

ErrNcrNonCharacter() защищенный Метод

protected ErrNcrNonCharacter ( char ch ) : char
ch char
Результат char

ErrNcrOutOfRange() защищенный Метод

protected ErrNcrOutOfRange ( ) : void
Результат void

ErrNcrSurrogate() защищенный Метод

protected ErrNcrSurrogate ( ) : void
Результат void

ErrNcrUnassigned() защищенный Метод

protected ErrNcrUnassigned ( ) : void
Результат void

ErrNcrZero() защищенный Метод

protected ErrNcrZero ( ) : void
Результат void

ErrNoDigitsInNCR() защищенный Метод

protected ErrNoDigitsInNCR ( ) : void
Результат void

ErrNoNamedCharacterMatch() защищенный Метод

protected ErrNoNamedCharacterMatch ( ) : void
Результат void

ErrNoSpaceBetweenAttributes() защищенный Метод

protected ErrNoSpaceBetweenAttributes ( ) : void
Результат void

ErrNoSpaceBetweenDoctypePublicKeywordAndQuote() защищенный Метод

protected ErrNoSpaceBetweenDoctypePublicKeywordAndQuote ( ) : void
Результат void

ErrNoSpaceBetweenDoctypeSystemKeywordAndQuote() защищенный Метод

protected ErrNoSpaceBetweenDoctypeSystemKeywordAndQuote ( ) : void
Результат void

ErrNoSpaceBetweenPublicAndSystemIds() защищенный Метод

protected ErrNoSpaceBetweenPublicAndSystemIds ( ) : void
Результат void

ErrNotSemicolonTerminated() защищенный Метод

protected ErrNotSemicolonTerminated ( ) : void
Результат void

ErrPrematureEndOfComment() защищенный Метод

protected ErrPrematureEndOfComment ( ) : void
Результат void

ErrProcessingInstruction() защищенный Метод

protected ErrProcessingInstruction ( ) : void
Результат void

ErrQuoteBeforeAttributeName() защищенный Метод

protected ErrQuoteBeforeAttributeName ( char c ) : void
c char
Результат void

ErrQuoteOrLtInAttributeNameOrNull() защищенный Метод

protected ErrQuoteOrLtInAttributeNameOrNull ( char c ) : void
c char
Результат void

ErrSlashNotFollowedByGt() защищенный Метод

protected ErrSlashNotFollowedByGt ( ) : void
Результат void

ErrTreeBuilder() публичный Метод

public ErrTreeBuilder ( string message ) : void
message string
Результат void

ErrUnescapedAmpersandInterpretedAsCharacterReference() защищенный Метод

protected ErrUnescapedAmpersandInterpretedAsCharacterReference ( ) : void
Результат void

ErrUnquotedAttributeValOrNull() защищенный Метод

protected ErrUnquotedAttributeValOrNull ( char c ) : void
c char
Результат void

ErrWarnLtSlashInRcdata() защищенный Метод

protected ErrWarnLtSlashInRcdata ( ) : void
Результат void

Fatal() публичный Метод

public Fatal ( string message ) : void
message string
Результат void

FlushChars() защищенный Метод

Flushes coalesced character tokens.
protected FlushChars ( char buf, int pos ) : void
buf char The buffer.
pos int The position.
Результат void

InitializeWithoutStarting() публичный Метод

public InitializeWithoutStarting ( ) : void
Результат void

InternalEncodingDeclaration() публичный Метод

public InternalEncodingDeclaration ( string internalCharset ) : bool
internalCharset string
Результат bool

LoadState() публичный Метод

public LoadState ( Tokenizer other ) : void
other Tokenizer
Результат void

MaybeErrAttributesOnEndTag() защищенный Метод

protected MaybeErrAttributesOnEndTag ( HtmlAttributes attrs ) : void
attrs HtmlAttributes
Результат void

MaybeErrSlashInEndTag() защищенный Метод

protected MaybeErrSlashInEndTag ( bool selfClosing ) : void
selfClosing bool
Результат void

MaybeWarnPrivateUse() защищенный Метод

protected MaybeWarnPrivateUse ( char ch ) : void
ch char
Результат void

MaybeWarnPrivateUseAstral() защищенный Метод

protected MaybeWarnPrivateUseAstral ( ) : void
Результат void

NoteAttributeWithoutValue() защищенный Метод

protected NoteAttributeWithoutValue ( ) : void
Результат void

NoteUnquotedAttributeValue() защищенный Метод

protected NoteUnquotedAttributeValue ( ) : void
Результат void

NotifyAboutMetaBoundary() публичный Метод

public NotifyAboutMetaBoundary ( ) : void
Результат void

RequestSuspension() публичный Метод

public RequestSuspension ( ) : void
Результат void

ResetToDataState() публичный Метод

public ResetToDataState ( ) : void
Результат void

SetStateAndEndTagExpectation() публичный Метод

public SetStateAndEndTagExpectation ( TokenizerState specialTokenizerState, ElementName endTagExpectation ) : void
specialTokenizerState TokenizerState
endTagExpectation ElementName
Результат void

SetStateAndEndTagExpectation() публичный Метод

public SetStateAndEndTagExpectation ( TokenizerState specialTokenizerState, [ endTagExpectation ) : void
specialTokenizerState TokenizerState
endTagExpectation [
Результат void

SetTransitionBaseOffset() публичный Метод

Sets an offset to be added to the position reported to TransitionHandler.
public SetTransitionBaseOffset ( int offset ) : void
offset int The offset.
Результат void

SilentCarriageReturn() защищенный Метод

protected SilentCarriageReturn ( ) : void
Результат void

SilentLineFeed() защищенный Метод

protected SilentLineFeed ( ) : void
Результат void

Start() публичный Метод

public Start ( ) : void
Результат void

StartErrorReporting() защищенный Метод

protected StartErrorReporting ( ) : void
Результат void

TokenizeBuffer() публичный Метод

public TokenizeBuffer ( UTF16Buffer buffer ) : bool
buffer UTF16Buffer
Результат bool

Tokenizer() публичный Метод

public Tokenizer ( ITokenHandler tokenHandler ) : System
tokenHandler ITokenHandler
Результат System

Tokenizer() публичный Метод

public Tokenizer ( ITokenHandler tokenHandler, bool newAttributesEachTime ) : System
tokenHandler ITokenHandler
newAttributesEachTime bool
Результат System

Warn() публичный Метод

public Warn ( string message ) : void
message string
Результат void

Описание свойств

ampersandLocation защищенное свойство

protected Locator ampersandLocation
Результат Locator

attributeName защищенное свойство

protected AttributeName attributeName
Результат AttributeName

confident защищенное свойство

protected bool confident
Результат bool

cstart защищенное свойство

protected int cstart
Результат int

endTag защищенное свойство

protected bool endTag
Результат bool

endTagExpectation защищенное свойство

protected ElementName endTagExpectation
Результат ElementName

html4 защищенное свойство

protected bool html4
Результат bool

index защищенное свойство

protected int index
Результат int

lastCR защищенное свойство

protected bool lastCR
Результат bool

stateSave защищенное свойство

protected TokenizerState stateSave
Результат TokenizerState

value защищенное свойство

protected int value
Результат int