C# Класс JiebaNet.Segmenter.JiebaSegmenter

Показать файл Открыть проект Примеры использования класса

Private Properties

Свойство Тип Описание
AddBufferToWordList void
Calc Pair>.IDictionary
CutAll IEnumerable
CutDag IEnumerable
CutDagWithoutHmm IEnumerable
CutIt IEnumerable
GetDag List>.IDictionary

Открытые методы

Метод Описание
AddWord ( string word, int freq, string tag = null ) : void
Cut ( string text, bool cutAll = false, bool hmm = true ) : IEnumerable

The main function that segments an entire sentence that contains Chinese characters into seperated words.

CutForSearch ( string text, bool hmm = true ) : IEnumerable
DeleteWord ( string word ) : void
JiebaSegmenter ( ) : System
LoadUserDict ( string userDictFile ) : void

Loads user dictionaries.

Tokenize ( string text, TokenizerMode mode = TokenizerMode.Default, bool hmm = true ) : IEnumerable

Приватные методы

Метод Описание
AddBufferToWordList ( List words, string buf ) : void
Calc ( string sentence, IDictionary dag ) : Pair>.IDictionary
CutAll ( string sentence ) : IEnumerable
CutDag ( string sentence ) : IEnumerable
CutDagWithoutHmm ( string sentence ) : IEnumerable
CutIt ( string text, Func cutMethod, Regex reHan, Regex reSkip, bool cutAll ) : IEnumerable
GetDag ( string sentence ) : List>.IDictionary

Описание методов

AddWord() публичный Метод

public AddWord ( string word, int freq, string tag = null ) : void
word string
freq int
tag string
Результат void

Cut() публичный Метод

The main function that segments an entire sentence that contains Chinese characters into seperated words.
public Cut ( string text, bool cutAll = false, bool hmm = true ) : IEnumerable
text string The string to be segmented.
cutAll bool Specify segmentation pattern. True for full pattern, False for accurate pattern.
hmm bool Whether to use the Hidden Markov Model.
Результат IEnumerable

CutForSearch() публичный Метод

public CutForSearch ( string text, bool hmm = true ) : IEnumerable
text string
hmm bool
Результат IEnumerable

DeleteWord() публичный Метод

public DeleteWord ( string word ) : void
word string
Результат void

JiebaSegmenter() публичный Метод

public JiebaSegmenter ( ) : System
Результат System

LoadUserDict() публичный Метод

Loads user dictionaries.
public LoadUserDict ( string userDictFile ) : void
userDictFile string
Результат void

Tokenize() публичный Метод

public Tokenize ( string text, TokenizerMode mode = TokenizerMode.Default, bool hmm = true ) : IEnumerable
text string
mode TokenizerMode
hmm bool
Результат IEnumerable