- a - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
形容词
- A - 类 中的静态变量com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary
-
bad case
- AbstractClassifier - com.hankcs.hanlp.classification.classifiers中的类
-
- AbstractClassifier() - 类 的构造器com.hankcs.hanlp.classification.classifiers.AbstractClassifier
-
- AbstractClosestVectors - com.hankcs.hanlp.mining.word2vec中的类
-
- AbstractClosestVectors(String) - 类 的构造器com.hankcs.hanlp.mining.word2vec.AbstractClosestVectors
-
- AbstractClosestVectors.Result - com.hankcs.hanlp.mining.word2vec中的类
-
- AbstractDataSet - com.hankcs.hanlp.classification.corpus中的类
-
- AbstractDataSet(AbstractModel) - 类 的构造器com.hankcs.hanlp.classification.corpus.AbstractDataSet
-
构造测试集
- AbstractDataSet() - 类 的构造器com.hankcs.hanlp.classification.corpus.AbstractDataSet
-
- AbstractDependencyParser - com.hankcs.hanlp.dependency中的类
-
- AbstractDependencyParser(Segment) - 类 的构造器com.hankcs.hanlp.dependency.AbstractDependencyParser
-
- AbstractDependencyParser() - 类 的构造器com.hankcs.hanlp.dependency.AbstractDependencyParser
-
- AbstractInexactAction - com.hankcs.hanlp.dependency.nnparser.action中的类
-
- AbstractInexactAction() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.action.AbstractInexactAction
-
- AbstractLexicalAnalyzer - com.hankcs.hanlp.tokenizer.lexical中的类
-
词法分析器基类(中文分词、词性标注和命名实体识别)
- AbstractLexicalAnalyzer() - 类 的构造器com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
- AbstractLexicalAnalyzer(Segmenter) - 类 的构造器com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
- AbstractLexicalAnalyzer(Segmenter, POSTagger) - 类 的构造器com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
- AbstractLexicalAnalyzer(Segmenter, POSTagger, NERecognizer) - 类 的构造器com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
- AbstractModel - com.hankcs.hanlp.classification.models中的类
-
所有文本分类模型的基类,包含基本的需要序列化的数据
- AbstractModel() - 类 的构造器com.hankcs.hanlp.classification.models.AbstractModel
-
- AbstractTrainer - com.hankcs.hanlp.mining.word2vec中的类
-
- AbstractTrainer() - 类 的构造器com.hankcs.hanlp.mining.word2vec.AbstractTrainer
-
- AbstractVectorModel<K> - com.hankcs.hanlp.mining.word2vec中的类
-
抽象的向量模型,将抽象的对象映射为向量
- AbstractVectorModel(Map<K, Vector>) - 类 的构造器com.hankcs.hanlp.mining.word2vec.AbstractVectorModel
-
- AbstractVectorModel() - 类 的构造器com.hankcs.hanlp.mining.word2vec.AbstractVectorModel
-
- acceptCustomWord(int, int, CoreDictionary.Attribute) - 类 中的方法com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
- accuracy - 类 中的变量com.hankcs.hanlp.classification.statistics.evaluations.FMeasure
-
分类准确率
- Action - com.hankcs.hanlp.dependency.nnparser.action中的类
-
- Action() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.action.Action
-
- Action(int, int) - 类 的构造器com.hankcs.hanlp.dependency.nnparser.action.Action
-
创建动作
- action - 类 中的变量com.hankcs.hanlp.dependency.perceptron.transition.configuration.BeamElement
-
- Action - com.hankcs.hanlp.dependency.perceptron.transition.parser中的枚举
-
Created by Mohammad Sadegh Rasooli.
- action - 类 中的变量com.hankcs.hanlp.dependency.perceptron.transition.parser.LabeledAction
-
- actionCost(Action, int, State) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.Instance
-
For the cost of an action given the gold dependencies
For more information see:
Yoav Goldberg and Joakim Nivre.
- ActionFactory - com.hankcs.hanlp.dependency.nnparser.action中的类
-
- ActionFactory() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.action.ActionFactory
-
- actionHistory - 类 中的变量com.hankcs.hanlp.dependency.perceptron.transition.configuration.Configuration
-
- ActionType - com.hankcs.hanlp.dependency.nnparser.action中的接口
-
arc-standard system (Nivre, 2004) 用到的动作,类似于 Yamada 和 Matsumoto 提出的分析动作
- ActionUtils - com.hankcs.hanlp.dependency.nnparser.action中的类
-
- ActionUtils() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.action.ActionUtils
-
- ad - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
副形词
- ada_alpha - 类 中的变量com.hankcs.hanlp.dependency.nnparser.option.LearnOption
-
- ada_eps - 类 中的变量com.hankcs.hanlp.dependency.nnparser.option.LearnOption
-
- AdaOption - com.hankcs.hanlp.dependency.nnparser.option中的类
-
- AdaOption() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.option.AdaOption
-
- add(E) - 类 中的方法com.hankcs.hanlp.algorithm.MaxHeap
-
添加一个元素
- add(K) - 类 中的方法com.hankcs.hanlp.classification.collections.FrequencyMap
-
增加一个词的词频
- add(Map<String, String[]>) - 类 中的方法com.hankcs.hanlp.classification.corpus.AbstractDataSet
-
- add(String, String) - 类 中的方法com.hankcs.hanlp.classification.corpus.FileDataSet
-
- add(String, String) - 接口 中的方法com.hankcs.hanlp.classification.corpus.IDataSet
-
往训练集中加入一个文档
- add(Map<String, String[]>) - 接口 中的方法com.hankcs.hanlp.classification.corpus.IDataSet
-
- add(String, String) - 类 中的方法com.hankcs.hanlp.classification.corpus.MemoryDataSet
-
- add(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
-
- add(SString) - 类 中的方法com.hankcs.hanlp.collection.sequence.SString
-
- add(String) - 类 中的方法com.hankcs.hanlp.collection.set.UnEmptyStringSet
-
- add(String, int) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
非覆盖模式添加
- add(String) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
非覆盖模式添加,值默认为当前集合大小
- add(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor
-
- add(IWord) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
-
向词典中加入一个词语
- add(String, String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
-
- add(Item) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
-
插入条目
- add(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
-
- add(String, V) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SimpleDictionary
-
向中加入单词
- add(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SuffixDictionary
-
添加一个词语
- add(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TFDictionary
-
- add(String) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.TermOccurrence
-
- add(String, String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
-
往自定义词典中插入一个新词(非覆盖模式)
动态增删不会持久化到词典文件
- add(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
-
往自定义词典中插入一个新词(非覆盖模式)
动态增删不会持久化到词典文件
- add(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary
-
加入停用词到停用词词典中
- add(String) - 类 中的方法com.hankcs.hanlp.mining.word.TermFrequencyCounter
-
- add(List<Term>) - 类 中的方法com.hankcs.hanlp.mining.word.TermFrequencyCounter
-
- add(TermFrequency) - 类 中的方法com.hankcs.hanlp.mining.word.TermFrequencyCounter
-
- add(Object, List<Term>) - 类 中的方法com.hankcs.hanlp.mining.word.TfIdfCounter
-
- add(List<Term>) - 类 中的方法com.hankcs.hanlp.mining.word.TfIdfCounter
-
- add(Object, String) - 类 中的方法com.hankcs.hanlp.mining.word.TfIdfCounter
-
添加文档
- add(String) - 类 中的方法com.hankcs.hanlp.mining.word.TfIdfCounter
-
添加文档,自动分配id
- add(Vector) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Vector
-
- add(Node, Node) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Path
-
- add(String[]) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Tagger
-
- add(String) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Tagger
-
- add(String) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- add(String[]) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- add(String) - 类 中的方法com.hankcs.hanlp.model.perceptron.common.FrequencyMap
-
- add(String) - 类 中的方法com.hankcs.hanlp.model.perceptron.tagset.TagSet
-
- add(int, char[]...) - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
-
- add(int, Collection<char[]>) - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
-
- add(int, Vertex) - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
-
添加顶点
- add(int, List<AtomNode>) - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
-
添加顶点,由原子分词顶点添加
- add(Pipe<List<IWord>, List<IWord>>) - 类 中的方法com.hankcs.hanlp.seg.SegmentPipeline
-
- add(int, Pipe<List<IWord>, List<IWord>>) - 类 中的方法com.hankcs.hanlp.seg.SegmentPipeline
-
- add(Pipe<M, M>) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.Pipeline
-
- add(int, Pipe<M, M>) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.Pipeline
-
- addAction(int) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.Configuration
-
- addAll(Collection<E>) - 类 中的方法com.hankcs.hanlp.algorithm.MaxHeap
-
添加许多元素
- addAll(Collection<? extends String>) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
-
- addAll(List<Item>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
-
插入全部条目
- addAll(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SuffixDictionary
-
- addAll(String[]) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SuffixDictionary
-
- addAll(String[]) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
- addAll(List<Term>) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
- addAll(String) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
- addAll(List<String>) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.TermOccurrence
-
- addAll(Collection<? extends TermFrequency>) - 类 中的方法com.hankcs.hanlp.mining.word.TermFrequencyCounter
-
- addAll(List<Vertex>) - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
-
全自动添加顶点
- addAll(Collection<? extends Pipe<List<IWord>, List<IWord>>>) - 类 中的方法com.hankcs.hanlp.seg.SegmentPipeline
-
- addAll(int, Collection<? extends Pipe<List<IWord>, List<IWord>>>) - 类 中的方法com.hankcs.hanlp.seg.SegmentPipeline
-
- addAll(Collection<? extends Pipe<M, M>>) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.Pipeline
-
- addAll(int, Collection<? extends Pipe<M, M>>) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.Pipeline
-
- addAllKeyword(Collection<String>) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Trie
-
- addAllNotCombine(List<Item>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
-
插入新条目,不执行合并
- addArc(int, int, int) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
- addAvailableBeamElements(ArrayList<BeamElement>, float, boolean, boolean, boolean, boolean, Object[], AveragedPerceptron, boolean, int, ArrayList<Integer>) - 类 中的静态方法com.hankcs.hanlp.dependency.perceptron.transition.parser.PartialTreeBeamScorerThread
-
- addCategory(String) - 类 中的方法com.hankcs.hanlp.classification.corpus.Catalog
-
- addChild(BaseNode) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
-
添加子节点
- addChild(BaseNode) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
-
- addChild(BaseNode) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.Node
-
- addDefaultNERLabels() - 类 中的方法com.hankcs.hanlp.model.crf.CRFNERecognizer
-
- addDocument(K, String) - 类 中的方法com.hankcs.hanlp.mining.cluster.ClusterAnalyzer
-
添加文档
- addDocument(K, List<String>) - 类 中的方法com.hankcs.hanlp.mining.cluster.ClusterAnalyzer
-
添加文档
- addDocument(int, String) - 类 中的方法com.hankcs.hanlp.mining.word2vec.DocVectorModel
-
添加文档
- addEmit(String) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
-
添加一个匹配到的模式串(这个状态对应着这个模式串)
- addEmit(Collection<String>) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
-
添加一些匹配到的模式串
- addEmit(int) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
-
添加一个匹配到的模式串(这个状态对应着这个模式串)
- addEmit(Collection<Integer>) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
-
添加一些匹配到的模式串
- addFeature(CharSequence, List<Integer>, FeatureMap) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.instance.Instance
-
- addFeature(String, FeatureMap, List<Integer>) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.PerceptronClassifier
-
向特征向量插入特征
- addFeatureThenClear(StringBuilder, List<Integer>, FeatureMap) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.instance.Instance
-
添加特征,同时清空缓存
- addFirst(Pipe<M, M>) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.Pipeline
-
以最高优先级加入管道
- addKeyword(String) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Trie
-
- addLabel(E) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.EnumItem
-
- addLabel(E, Integer) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.EnumItem
-
- addLabel(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
-
- addLabel(String, Integer) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
-
添加一个标签和频次
- addLast(Pipe<M, M>) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.Pipeline
-
以最低优先级加入管道
- addNERLabels(String) - 类 中的方法com.hankcs.hanlp.model.crf.CRFNERecognizer
-
- addNotCombine(Item) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
-
插入条目,但是不合并,如果已有则忽略
- addOutgoingTransition(char, boolean) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
新建一个转移目标
Creates an outgoing _transition labeled with a
given char that has a new node as its target.
- addOutgoingTransition(char, MDAGNode) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
建立一条边(起点是自己)
- addPair(IWord, IWord) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker
-
- addPair(String, String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TMDictionaryMaker
-
添加一个转移例子,会在内部完成统计
- addPair(String, String) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
添加一个共现
- addScore(float) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.Configuration
-
- addSentence(String) - 接口 中的方法com.hankcs.hanlp.suggest.ISuggester
-
- addSentence(String) - 类 中的方法com.hankcs.hanlp.suggest.scorer.BaseScorer
-
- addSentence(String) - 接口 中的方法com.hankcs.hanlp.suggest.scorer.IScorer
-
输入一个候选句子
- addSentence(String) - 类 中的方法com.hankcs.hanlp.suggest.Suggester
-
- addState(Character) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
-
- addState(Character) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
-
- addString(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
-
Adds a string to the MDAG.
- addStrings(Collection<String>) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
-
Adds a Collection of Strings to the MDAG.
- addTerm(String) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
统计词频
- addToDictionary(List<List<IWord>>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker
-
加入到词典中,允许子类自定义过滤等等,这样比较灵活
- addToDictionary(List<List<IWord>>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NatureDictionaryMaker
-
- addToDictionary(List<List<IWord>>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NRDictionaryMaker
-
- addToDictionary(List<List<IWord>>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NSDictionaryMaker
-
- addToDictionary(List<List<IWord>>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NTDictionaryMaker
-
- addToOverlaps(Intervalable, List<Intervalable>, List<Intervalable>) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalNode
-
添加到重叠区间列表中
- addToSelf(Vector) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Vector
-
- addTria(String, String, String) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
- addWord(String) - 类 中的方法com.hankcs.hanlp.classification.corpus.Lexicon
-
- addWordToVocab(String) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Corpus
-
Adds a word to the vocabulary
- ag - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
形容词性语素
- aggregation - 类 中的变量com.hankcs.hanlp.mining.word.WordInfo
-
互信息
- AhoCorasickDoubleArrayTrie<V> - com.hankcs.hanlp.collection.AhoCorasick中的类
-
基于双数组Trie树的AhoCorasick自动机
- AhoCorasickDoubleArrayTrie() - 类 的构造器com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
-
- AhoCorasickDoubleArrayTrie(TreeMap<String, V>) - 类 的构造器com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
-
由一个词典创建
- AhoCorasickDoubleArrayTrie.Hit<V> - com.hankcs.hanlp.collection.AhoCorasick中的类
-
一个命中结果
- AhoCorasickDoubleArrayTrie.IHit<V> - com.hankcs.hanlp.collection.AhoCorasick中的接口
-
命中一个模式串的处理方法
- AhoCorasickDoubleArrayTrie.IHitFull<V> - com.hankcs.hanlp.collection.AhoCorasick中的接口
-
- AhoCorasickDoubleArrayTrieSegment - com.hankcs.hanlp.seg.Other中的类
-
使用AhoCorasickDoubleArrayTrie实现的最长分词器
需要用户调用setTrie()提供一个AhoCorasickDoubleArrayTrie
- AhoCorasickDoubleArrayTrieSegment() - 类 的构造器com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment
-
- AhoCorasickDoubleArrayTrieSegment(TreeMap<String, CoreDictionary.Attribute>) - 类 的构造器com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment
-
- AhoCorasickDoubleArrayTrieSegment(AhoCorasickDoubleArrayTrie<CoreDictionary.Attribute>) - 类 的构造器com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment
-
- AhoCorasickDoubleArrayTrieSegment(String...) - 类 的构造器com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment
-
加载自己的词典,构造分词器
- al - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
形容词性惯用语
- algorithm - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.crf_learn.Option
-
- all() - 类 中的方法com.hankcs.hanlp.mining.word.TermFrequencyCounter
-
所有词汇的频次
- allLabels() - 类 中的方法com.hankcs.hanlp.model.perceptron.feature.FeatureMap
-
- allLabels() - 类 中的方法com.hankcs.hanlp.model.perceptron.feature.MutableFeatureMap
-
- allTags() - 类 中的方法com.hankcs.hanlp.model.perceptron.tagset.TagSet
-
获取所有标签及其下标
- allTf() - 类 中的方法com.hankcs.hanlp.mining.word.TfIdfCounter
-
- alpha - 类 中的变量com.hankcs.hanlp.mining.word2vec.Config
-
- alpha - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.Node
-
- alpha(int, int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Tagger
-
- alpha(int, int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- alpha_ - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- Alphabet - com.hankcs.hanlp.dependency.nnparser中的类
-
int 到 String 的双向map
- Alphabet() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Alphabet
-
- alphaFloat_ - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- an - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
名形词
- analogy(String, String, String) - 类 中的方法com.hankcs.hanlp.mining.word2vec.WordVectorModel
-
返回跟 A - B + C 最相似的词语,比如 中国 - 北京 + 东京 = 日本。
- analogy(String, String, String, int) - 类 中的方法com.hankcs.hanlp.mining.word2vec.WordVectorModel
-
返回跟 A - B + C 最相似的词语,比如 中国 - 北京 + 东京 = 日本。
- analyze(String) - 类 中的方法com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
- analyze(String) - 接口 中的方法com.hankcs.hanlp.tokenizer.lexical.LexicalAnalyzer
-
对句子进行词法分析
- analyze(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.NLPTokenizer
-
词法分析
- analyze(String) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.LexicalAnalyzerPipeline
-
- ANALYZER - 类 中的静态变量com.hankcs.hanlp.tokenizer.NLPTokenizer
-
预置分词器
- analyzer - 类 中的变量com.hankcs.hanlp.tokenizer.pipe.LexicalAnalyzerPipe
-
代理的词法分析器
- answer(int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Tagger
-
- answer(int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- append(int) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.IntArrayList
-
在数组尾部新增一个元素
- apply(List<Term>) - 类 中的静态方法com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary
-
对分词结果应用过滤
- applyRule(String, int, TaggerImpl) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- ArcEager - com.hankcs.hanlp.dependency.perceptron.transition.parser中的类
-
- ArcEagerBeamTrainer - com.hankcs.hanlp.dependency.perceptron.transition.trainer中的类
-
- ArcEagerBeamTrainer(String, AveragedPerceptron, Options, ArrayList<Integer>, int, IndexMaps) - 类 的构造器com.hankcs.hanlp.dependency.perceptron.transition.trainer.ArcEagerBeamTrainer
-
- arcs - 类 中的变量com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
Keeps dependent->head information
- argPos(String, String[]) - 类 中的方法com.hankcs.hanlp.mining.word2vec.AbstractTrainer
-
- argPos(String, String[], boolean) - 类 中的方法com.hankcs.hanlp.mining.word2vec.AbstractTrainer
-
- Args - com.hankcs.hanlp.model.perceptron.cli中的类
-
- Args() - 类 的构造器com.hankcs.hanlp.model.perceptron.cli.Args
-
- Args.ValueCreator - com.hankcs.hanlp.model.perceptron.cli中的接口
-
- Argument - com.hankcs.hanlp.model.perceptron.cli中的注释类型
-
- ArrayCompare - com.hankcs.hanlp.algorithm中的类
-
比较两个数组
- ArrayCompare() - 类 的构造器com.hankcs.hanlp.algorithm.ArrayCompare
-
- ArrayDistance - com.hankcs.hanlp.algorithm中的类
-
求两个集合中最相近的两个数
- ArrayDistance() - 类 的构造器com.hankcs.hanlp.algorithm.ArrayDistance
-
- arrayLeftDivide(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Element-by-element left division, C = A.
- arrayLeftDivideEquals(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Element-by-element left division in place, A = A.
- arrayRightDivide(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Element-by-element right division, C = A.
- arrayRightDivideEquals(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Element-by-element right division in place, A = A.
- arrayTimes(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Element-by-element multiplication, C = A.
- arrayTimesEquals(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Element-by-element multiplication in place, A = A.
- ArrayTool - com.hankcs.hanlp.collection.trie.bintrie.util中的类
-
- ArrayTool() - 类 的构造器com.hankcs.hanlp.collection.trie.bintrie.util.ArrayTool
-
- AtomNode - com.hankcs.hanlp.seg.NShort.Path中的类
-
原子分词节点
- AtomNode(String, int) - 类 的构造器com.hankcs.hanlp.seg.NShort.Path.AtomNode
-
- AtomNode(char, int) - 类 的构造器com.hankcs.hanlp.seg.NShort.Path.AtomNode
-
- atomSegment(char[]) - 类 中的静态方法com.hankcs.hanlp.seg.CRF.CRFSegment
-
已过时。
- atomSegment(char[], int, int) - 类 中的静态方法com.hankcs.hanlp.seg.Segment
-
原子分词
- atomSegmentToTable(char[]) - 类 中的静态方法com.hankcs.hanlp.seg.CRF.CRFSegment
-
已过时。
- Attribute(int) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
-
- Attribute(Nature[], int[]) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
-
- Attribute(Nature, int) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
-
- Attribute(Nature) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
-
使用单个词性,默认词频1000构造
- Attribute(int) - 类 的构造器com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
-
- Attribute(Nature[], int[]) - 类 的构造器com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
-
- Attribute(Nature, int) - 类 的构造器com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
-
- Attribute(Nature[], int[], int) - 类 的构造器com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
-
- Attribute(Nature) - 类 的构造器com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
-
使用单个词性,默认词频1000构造
- ATTRIBUTE - 类 中的静态变量com.hankcs.hanlp.dictionary.nr.NRConstant
-
本词典专注的词的属性
- ATTRIBUTE - 类 中的静态变量com.hankcs.hanlp.dictionary.nr.PersonDictionary
-
- attribute - 类 中的变量com.hankcs.hanlp.seg.common.Vertex
-
词的属性,谨慎修改属性内部的数据,因为会影响到字典
如果要修改,应当new一个Attribute
- average(double[], int[], int) - 类 中的方法com.hankcs.hanlp.model.perceptron.model.AveragedPerceptron
-
- average(double[]) - 类 中的静态方法com.hankcs.hanlp.utility.MathUtility
-
- average_accuracy - 类 中的变量com.hankcs.hanlp.classification.statistics.evaluations.FMeasure
-
平均准确率
- average_f1 - 类 中的变量com.hankcs.hanlp.classification.statistics.evaluations.FMeasure
-
平均F1
- average_precision - 类 中的变量com.hankcs.hanlp.classification.statistics.evaluations.FMeasure
-
平均精确率
- average_recall - 类 中的变量com.hankcs.hanlp.classification.statistics.evaluations.FMeasure
-
平均召回率
- AveragedPerceptron - com.hankcs.hanlp.dependency.perceptron.learning中的类
-
- AveragedPerceptron(int, int) - 类 的构造器com.hankcs.hanlp.dependency.perceptron.learning.AveragedPerceptron
-
- AveragedPerceptron(ParserModel) - 类 的构造器com.hankcs.hanlp.dependency.perceptron.learning.AveragedPerceptron
-
- AveragedPerceptron - com.hankcs.hanlp.model.perceptron.model中的类
-
平均感知机算法学习的线性模型
- AveragedPerceptron(FeatureMap, float[]) - 类 的构造器com.hankcs.hanlp.model.perceptron.model.AveragedPerceptron
-
- AveragedPerceptron(FeatureMap) - 类 的构造器com.hankcs.hanlp.model.perceptron.model.AveragedPerceptron
-
- c - 类 中的变量com.hankcs.hanlp.classification.models.NaiveBayesModel
-
类别数
- c - 类 中的变量com.hankcs.hanlp.collection.trie.bintrie.BaseNode
-
节点代表的字符
- c - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
连词
- c - 类 中的变量com.hankcs.hanlp.dictionary.BaseSearcher
-
待分词文本的char
- CacheCorpus - com.hankcs.hanlp.mining.word2vec中的类
-
load corpus from disk cache
- CacheCorpus(Corpus) - 类 的构造器com.hankcs.hanlp.mining.word2vec.CacheCorpus
-
- cacheFile - 类 中的变量com.hankcs.hanlp.mining.word2vec.Corpus
-
- calcAlpha() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Node
-
- calcBeta() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Node
-
- calcCost(Node) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
计算状态特征函数的代价
- calcCost(Path) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
计算转移特征函数的代价
- calcExpectation(double[], double, int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Node
-
计算节点期望
- calcExpectation(double[], double, int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Path
-
计算边的期望
- calculateWeight(Vertex, Vertex) - 类 中的静态方法com.hankcs.hanlp.utility.MathUtility
-
从一个词到另一个词的词的花费
- call() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.parser.BeamScorerThread
-
- call() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.parser.ParseTaggedThread
-
- call() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.parser.ParseThread
-
- call() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.parser.PartialTreeBeamScorerThread
-
- call() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.CRFEncoderThread
-
- canDo(Action, State) - 类 中的静态方法com.hankcs.hanlp.dependency.perceptron.transition.parser.ArcEager
-
- CanGetNext() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.CQueue
-
是否仍然有下一个元素可供读取
- catalog - 类 中的变量com.hankcs.hanlp.classification.corpus.AbstractDataSet
-
- Catalog - com.hankcs.hanlp.classification.corpus中的类
-
类目名称和id的对应关系
- Catalog() - 类 的构造器com.hankcs.hanlp.classification.corpus.Catalog
-
- Catalog(String[]) - 类 的构造器com.hankcs.hanlp.classification.corpus.Catalog
-
- catalog - 类 中的变量com.hankcs.hanlp.classification.models.AbstractModel
-
类目表
- catalog - 类 中的变量com.hankcs.hanlp.classification.statistics.evaluations.FMeasure
-
分类名称
- categorize(Document) - 接口 中的方法com.hankcs.hanlp.classification.classifiers.IClassifier
-
预测分类
- categorize(Document) - 类 中的方法com.hankcs.hanlp.classification.classifiers.NaiveBayesClassifier
-
- category - 类 中的变量com.hankcs.hanlp.classification.corpus.Document
-
文档所属类目
- categoryCounts - 类 中的变量com.hankcs.hanlp.classification.features.BaseFeatureData
-
每个类目中的文档数量
- cbow - 类 中的变量com.hankcs.hanlp.mining.word2vec.Config
-
- cc - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
并列连词
- changeFeatureWeight(HashMap<Object, CompactArray>, HashMap<Object, CompactArray>, Object, int, float, int) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.learning.AveragedPerceptron
-
- changePunc(String) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.accessories.Options
-
- changeWeight(Action, int, Object, int, float) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.learning.AveragedPerceptron
-
- CharacterBasedGenerativeModel - com.hankcs.hanlp.model.trigram中的类
-
基于字符的生成模型(其实就是一个TriGram文法模型,或称2阶隐马模型)
- CharacterBasedGenerativeModel() - 类 的构造器com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel
-
- CharacterBasedSegment - com.hankcs.hanlp.seg中的类
-
基于“由字构词”方法分词器基类
- CharacterBasedSegment() - 类 的构造器com.hankcs.hanlp.seg.CharacterBasedSegment
-
- CharacterHelper - com.hankcs.hanlp.utility中的类
-
字符集识别辅助工具类
- CharacterHelper() - 类 的构造器com.hankcs.hanlp.utility.CharacterHelper
-
- CharacterMapping - com.hankcs.hanlp.collection.trie.datrie中的接口
-
字符映射接口
- charArray - 类 中的变量com.hankcs.hanlp.seg.common.WordNet
-
原始句子对应的数组
- CharArray - com.hankcs.hanlp.suggest.scorer.editdistance中的类
-
对字符数组的封装,可以代替String
- CharArray(char[]) - 类 的构造器com.hankcs.hanlp.suggest.scorer.editdistance.CharArray
-
- charAt(int) - 类 中的方法com.hankcs.hanlp.collection.sequence.SString
-
- CharTable - com.hankcs.hanlp.dictionary.other中的类
-
字符正规化表
- CharTable() - 类 的构造器com.hankcs.hanlp.dictionary.other.CharTable
-
- CharTablePath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
-
字符正规化表(全角转半角,繁体转简体)
- charToBytes(char) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
-
将一个char字符转换位字节数组(2个字节),b[0]存储高位字符,大端
- charTreeSet - 类 中的变量com.hankcs.hanlp.collection.MDAG.MDAG
-
字母表
- CharType - com.hankcs.hanlp.dictionary.other中的类
-
字符类型
- CharType() - 类 的构造器com.hankcs.hanlp.dictionary.other.CharType
-
- charType(char) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
-
- charType(String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
-
判断字符类型
- CharTypePath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
-
字符类型对应表
- check - 类 中的变量com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
-
双数组值check
- check - 类 中的变量com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- checkForOverlaps(Intervalable, IntervalNode.Direction) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalNode
-
寻找重叠
- checkForOverlapsToTheLeft(Intervalable) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalNode
-
往左边寻找重叠
- checkForOverlapsToTheRight(Intervalable) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalNode
-
往右边寻找重叠
- checkMaxXsize_ - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- chi_square(BaseFeatureData) - 类 中的方法com.hankcs.hanlp.classification.features.ChiSquareFeatureExtractor
-
使用卡方非参数校验来执行特征选择
https://nlp.stanford.edu/IR-book/html/htmledition/feature-selectionchi2-feature-selection-1.html
- child - 类 中的变量com.hankcs.hanlp.collection.trie.bintrie.BaseNode
-
子节点
- CHINESE_NUMBERS - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
- ChisquareCdf(double, int) - 类 中的静态方法com.hankcs.hanlp.classification.statistics.ContinuousDistributions
-
给定卡方值和自由度,计算从0到x的累积分布函数值
- chisquareCriticalValue - 类 中的变量com.hankcs.hanlp.classification.features.ChiSquareFeatureExtractor
-
在P值(拒真错误概率)为0.001时的卡方临界值,用于特征选择算法
- ChiSquareFeatureExtractor - com.hankcs.hanlp.classification.features中的类
-
特征提取,用来生成FeatureStats并且使用卡方测试选择最佳特征
- ChiSquareFeatureExtractor() - 类 的构造器com.hankcs.hanlp.classification.features.ChiSquareFeatureExtractor
-
- ChisquareInverseCdf(double, int) - 类 中的静态方法com.hankcs.hanlp.classification.statistics.ContinuousDistributions
-
给定卡方分布的p值和自由度,返回卡方值。
- cint(String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
-
把表示数字含义的字符串转成整形
- classifier - 类 中的变量com.hankcs.hanlp.dependency.perceptron.transition.parser.TransitionBasedParser
-
Any kind of classifier that can give us scores
- classify(String) - 类 中的方法com.hankcs.hanlp.classification.classifiers.AbstractClassifier
-
使用一个训练出来的分类器来预测分类
- classify(Document) - 类 中的方法com.hankcs.hanlp.classification.classifiers.AbstractClassifier
-
- classify(String) - 接口 中的方法com.hankcs.hanlp.classification.classifiers.IClassifier
-
预测最可能的分类
- classify(Document) - 接口 中的方法com.hankcs.hanlp.classification.classifiers.IClassifier
-
预测最可能的分类
- clean() - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
-
清理from属性
- clear() - 类 中的方法com.hankcs.hanlp.classification.corpus.FileDataSet
-
- clear() - 接口 中的方法com.hankcs.hanlp.classification.corpus.IDataSet
-
清空数据集
- clear() - 类 中的方法com.hankcs.hanlp.classification.corpus.MemoryDataSet
-
- clear() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
-
- clear() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
-
- clear() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrie
-
- clear() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
- clear() - 类 中的方法com.hankcs.hanlp.mining.word.TermFrequencyCounter
-
- clear() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.EncoderFeatureIndex
-
- clear() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- clear() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.LbfgsOptimizer
-
- clear() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Node
-
- clear() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Path
-
- clear() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Tagger
-
- clear() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- clear() - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
-
清空词图
- clear() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.CQueue
-
清除所有元素
- clear() - 类 中的方法com.hankcs.hanlp.seg.SegmentPipeline
-
- clear() - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.Pipeline
-
- clear() - 类 中的静态方法com.hankcs.hanlp.utility.GlobalObjectPool
-
清空全局变量
- clearNodes() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- clearStoredHashCode() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
Clears this node's stored hash value
- clone() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
克隆一个状态
Creates an MDAGNode possessing the same accept state status and outgoing transitions as this node.
- clone(MDAGNode, char) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
克隆一个状态
原来soleParentNode转移到本状态,现在转移到克隆后的状态
Creates an MDAGNode possessing the same accept state status ant _transition set
(incoming & outgoing) as this node. outgoing transitions as this node.
- clone() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Clone the Matrix object.
- clone() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.accessories.Edge
-
- clone() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.accessories.Options
-
- clone() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.accessories.Pair
-
- clone() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.Configuration
-
- clone() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
- close() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
-
通知执行关闭/销毁操作
- close() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArrayFileStream
-
- close() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArrayOtherStream
-
- close() - 类 中的方法com.hankcs.hanlp.corpus.io.IOUtil.LineIterator
-
- close() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Corpus
-
Close the corpus and it cannot be read any more.
- close() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Model
-
- close() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Tagger
-
- close() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- Cluster<K> - com.hankcs.hanlp.mining.cluster中的类
-
- Cluster() - 类 的构造器com.hankcs.hanlp.mining.cluster.Cluster
-
- Cluster(List<Document<K>>) - 类 的构造器com.hankcs.hanlp.mining.cluster.Cluster
-
- ClusterAnalyzer<K> - com.hankcs.hanlp.mining.cluster中的类
-
文本聚类
- ClusterAnalyzer() - 类 的构造器com.hankcs.hanlp.mining.cluster.ClusterAnalyzer
-
- clusterFile - 类 中的变量com.hankcs.hanlp.dependency.perceptron.accessories.Options
-
- clusterId(String) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.structures.IndexMaps
-
获取聚类id
- clustering() - 类 中的方法com.hankcs.hanlp.mining.word2vec.KMeansClustering
-
- col(int) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
取出第j列作为一个列向量
- CollectionUtility - com.hankcs.hanlp.classification.utilities中的类
-
- CollectionUtility() - 类 的构造器com.hankcs.hanlp.classification.utilities.CollectionUtility
-
- collins(List<Double>) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- cols() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
- com.hankcs.hanlp - 程序包 com.hankcs.hanlp
-
- com.hankcs.hanlp.algorithm - 程序包 com.hankcs.hanlp.algorithm
-
- com.hankcs.hanlp.algorithm.ahocorasick.interval - 程序包 com.hankcs.hanlp.algorithm.ahocorasick.interval
-
- com.hankcs.hanlp.algorithm.ahocorasick.trie - 程序包 com.hankcs.hanlp.algorithm.ahocorasick.trie
-
- com.hankcs.hanlp.classification.classifiers - 程序包 com.hankcs.hanlp.classification.classifiers
-
- com.hankcs.hanlp.classification.collections - 程序包 com.hankcs.hanlp.classification.collections
-
- com.hankcs.hanlp.classification.corpus - 程序包 com.hankcs.hanlp.classification.corpus
-
- com.hankcs.hanlp.classification.features - 程序包 com.hankcs.hanlp.classification.features
-
- com.hankcs.hanlp.classification.models - 程序包 com.hankcs.hanlp.classification.models
-
- com.hankcs.hanlp.classification.statistics - 程序包 com.hankcs.hanlp.classification.statistics
-
- com.hankcs.hanlp.classification.statistics.evaluations - 程序包 com.hankcs.hanlp.classification.statistics.evaluations
-
- com.hankcs.hanlp.classification.tokenizers - 程序包 com.hankcs.hanlp.classification.tokenizers
-
- com.hankcs.hanlp.classification.utilities - 程序包 com.hankcs.hanlp.classification.utilities
-
- com.hankcs.hanlp.classification.utilities.io - 程序包 com.hankcs.hanlp.classification.utilities.io
-
- com.hankcs.hanlp.collection.AhoCorasick - 程序包 com.hankcs.hanlp.collection.AhoCorasick
-
- com.hankcs.hanlp.collection.dartsclone - 程序包 com.hankcs.hanlp.collection.dartsclone
-
- com.hankcs.hanlp.collection.dartsclone.details - 程序包 com.hankcs.hanlp.collection.dartsclone.details
-
- com.hankcs.hanlp.collection.MDAG - 程序包 com.hankcs.hanlp.collection.MDAG
-
- com.hankcs.hanlp.collection.sequence - 程序包 com.hankcs.hanlp.collection.sequence
-
- com.hankcs.hanlp.collection.set - 程序包 com.hankcs.hanlp.collection.set
-
- com.hankcs.hanlp.collection.trie - 程序包 com.hankcs.hanlp.collection.trie
-
- com.hankcs.hanlp.collection.trie.bintrie - 程序包 com.hankcs.hanlp.collection.trie.bintrie
-
- com.hankcs.hanlp.collection.trie.bintrie.util - 程序包 com.hankcs.hanlp.collection.trie.bintrie.util
-
- com.hankcs.hanlp.collection.trie.datrie - 程序包 com.hankcs.hanlp.collection.trie.datrie
-
可变双数组trie树,可以当做Map来用。
- com.hankcs.hanlp.corpus.dependency.CoNll - 程序包 com.hankcs.hanlp.corpus.dependency.CoNll
-
- com.hankcs.hanlp.corpus.dependency.model - 程序包 com.hankcs.hanlp.corpus.dependency.model
-
- com.hankcs.hanlp.corpus.dictionary - 程序包 com.hankcs.hanlp.corpus.dictionary
-
- com.hankcs.hanlp.corpus.dictionary.item - 程序包 com.hankcs.hanlp.corpus.dictionary.item
-
- com.hankcs.hanlp.corpus.document - 程序包 com.hankcs.hanlp.corpus.document
-
- com.hankcs.hanlp.corpus.document.sentence - 程序包 com.hankcs.hanlp.corpus.document.sentence
-
- com.hankcs.hanlp.corpus.document.sentence.word - 程序包 com.hankcs.hanlp.corpus.document.sentence.word
-
- com.hankcs.hanlp.corpus.io - 程序包 com.hankcs.hanlp.corpus.io
-
- com.hankcs.hanlp.corpus.occurrence - 程序包 com.hankcs.hanlp.corpus.occurrence
-
- com.hankcs.hanlp.corpus.synonym - 程序包 com.hankcs.hanlp.corpus.synonym
-
- com.hankcs.hanlp.corpus.tag - 程序包 com.hankcs.hanlp.corpus.tag
-
- com.hankcs.hanlp.corpus.util - 程序包 com.hankcs.hanlp.corpus.util
-
- com.hankcs.hanlp.dependency - 程序包 com.hankcs.hanlp.dependency
-
- com.hankcs.hanlp.dependency.common - 程序包 com.hankcs.hanlp.dependency.common
-
- com.hankcs.hanlp.dependency.nnparser - 程序包 com.hankcs.hanlp.dependency.nnparser
-
- com.hankcs.hanlp.dependency.nnparser.action - 程序包 com.hankcs.hanlp.dependency.nnparser.action
-
- com.hankcs.hanlp.dependency.nnparser.option - 程序包 com.hankcs.hanlp.dependency.nnparser.option
-
- com.hankcs.hanlp.dependency.nnparser.util - 程序包 com.hankcs.hanlp.dependency.nnparser.util
-
- com.hankcs.hanlp.dependency.perceptron - 程序包 com.hankcs.hanlp.dependency.perceptron
-
本package是对Yara Parser的包装与优化,主要做了如下几点优化
- 代码重构,提高复用率(由于dynamic oracle需要在训练的过程中逐渐动态地创建特征,
所以无法复用HanLP的感知机框架,这也是为什么选择直接包装该模块而不是重新实现的原因之一。)
- com.hankcs.hanlp.dependency.perceptron.accessories - 程序包 com.hankcs.hanlp.dependency.perceptron.accessories
-
- com.hankcs.hanlp.dependency.perceptron.learning - 程序包 com.hankcs.hanlp.dependency.perceptron.learning
-
- com.hankcs.hanlp.dependency.perceptron.parser - 程序包 com.hankcs.hanlp.dependency.perceptron.parser
-
- com.hankcs.hanlp.dependency.perceptron.structures - 程序包 com.hankcs.hanlp.dependency.perceptron.structures
-
- com.hankcs.hanlp.dependency.perceptron.transition.configuration - 程序包 com.hankcs.hanlp.dependency.perceptron.transition.configuration
-
- com.hankcs.hanlp.dependency.perceptron.transition.features - 程序包 com.hankcs.hanlp.dependency.perceptron.transition.features
-
- com.hankcs.hanlp.dependency.perceptron.transition.parser - 程序包 com.hankcs.hanlp.dependency.perceptron.transition.parser
-
- com.hankcs.hanlp.dependency.perceptron.transition.trainer - 程序包 com.hankcs.hanlp.dependency.perceptron.transition.trainer
-
- com.hankcs.hanlp.dictionary - 程序包 com.hankcs.hanlp.dictionary
-
- com.hankcs.hanlp.dictionary.common - 程序包 com.hankcs.hanlp.dictionary.common
-
- com.hankcs.hanlp.dictionary.nr - 程序包 com.hankcs.hanlp.dictionary.nr
-
- com.hankcs.hanlp.dictionary.ns - 程序包 com.hankcs.hanlp.dictionary.ns
-
- com.hankcs.hanlp.dictionary.nt - 程序包 com.hankcs.hanlp.dictionary.nt
-
- com.hankcs.hanlp.dictionary.other - 程序包 com.hankcs.hanlp.dictionary.other
-
- com.hankcs.hanlp.dictionary.py - 程序包 com.hankcs.hanlp.dictionary.py
-
- com.hankcs.hanlp.dictionary.stopword - 程序包 com.hankcs.hanlp.dictionary.stopword
-
- com.hankcs.hanlp.dictionary.ts - 程序包 com.hankcs.hanlp.dictionary.ts
-
- com.hankcs.hanlp.mining - 程序包 com.hankcs.hanlp.mining
-
这个包下面是一些文本挖掘工具(主要是无监督方法)
- com.hankcs.hanlp.mining.cluster - 程序包 com.hankcs.hanlp.mining.cluster
-
文本聚类模块(k-means和repeated bisection)
参考文献 Steinbach M, Karypis G, Kumar V.
- com.hankcs.hanlp.mining.phrase - 程序包 com.hankcs.hanlp.mining.phrase
-
- com.hankcs.hanlp.mining.word - 程序包 com.hankcs.hanlp.mining.word
-
- com.hankcs.hanlp.mining.word2vec - 程序包 com.hankcs.hanlp.mining.word2vec
-
Java移植版的word2vec,最大程度上与原版一致。
- com.hankcs.hanlp.model - 程序包 com.hankcs.hanlp.model
-
- com.hankcs.hanlp.model.bigram - 程序包 com.hankcs.hanlp.model.bigram
-
- com.hankcs.hanlp.model.crf - 程序包 com.hankcs.hanlp.model.crf
-
- com.hankcs.hanlp.model.crf.crfpp - 程序包 com.hankcs.hanlp.model.crf.crfpp
-
- com.hankcs.hanlp.model.hmm - 程序包 com.hankcs.hanlp.model.hmm
-
- com.hankcs.hanlp.model.maxent - 程序包 com.hankcs.hanlp.model.maxent
-
- com.hankcs.hanlp.model.perceptron - 程序包 com.hankcs.hanlp.model.perceptron
-
感知机在线学习算法的线性序列标注模型。
- com.hankcs.hanlp.model.perceptron.cli - 程序包 com.hankcs.hanlp.model.perceptron.cli
-
- com.hankcs.hanlp.model.perceptron.common - 程序包 com.hankcs.hanlp.model.perceptron.common
-
- com.hankcs.hanlp.model.perceptron.feature - 程序包 com.hankcs.hanlp.model.perceptron.feature
-
- com.hankcs.hanlp.model.perceptron.instance - 程序包 com.hankcs.hanlp.model.perceptron.instance
-
- com.hankcs.hanlp.model.perceptron.model - 程序包 com.hankcs.hanlp.model.perceptron.model
-
- com.hankcs.hanlp.model.perceptron.tagset - 程序包 com.hankcs.hanlp.model.perceptron.tagset
-
- com.hankcs.hanlp.model.perceptron.utility - 程序包 com.hankcs.hanlp.model.perceptron.utility
-
- com.hankcs.hanlp.model.trigram - 程序包 com.hankcs.hanlp.model.trigram
-
- com.hankcs.hanlp.model.trigram.frequency - 程序包 com.hankcs.hanlp.model.trigram.frequency
-
- com.hankcs.hanlp.recognition.nr - 程序包 com.hankcs.hanlp.recognition.nr
-
- com.hankcs.hanlp.recognition.ns - 程序包 com.hankcs.hanlp.recognition.ns
-
- com.hankcs.hanlp.recognition.nt - 程序包 com.hankcs.hanlp.recognition.nt
-
- com.hankcs.hanlp.seg - 程序包 com.hankcs.hanlp.seg
-
- com.hankcs.hanlp.seg.common - 程序包 com.hankcs.hanlp.seg.common
-
- com.hankcs.hanlp.seg.common.wrapper - 程序包 com.hankcs.hanlp.seg.common.wrapper
-
- com.hankcs.hanlp.seg.CRF - 程序包 com.hankcs.hanlp.seg.CRF
-
- com.hankcs.hanlp.seg.Dijkstra - 程序包 com.hankcs.hanlp.seg.Dijkstra
-
- com.hankcs.hanlp.seg.Dijkstra.Path - 程序包 com.hankcs.hanlp.seg.Dijkstra.Path
-
- com.hankcs.hanlp.seg.HMM - 程序包 com.hankcs.hanlp.seg.HMM
-
- com.hankcs.hanlp.seg.NShort - 程序包 com.hankcs.hanlp.seg.NShort
-
- com.hankcs.hanlp.seg.NShort.Path - 程序包 com.hankcs.hanlp.seg.NShort.Path
-
- com.hankcs.hanlp.seg.Other - 程序包 com.hankcs.hanlp.seg.Other
-
- com.hankcs.hanlp.seg.Viterbi - 程序包 com.hankcs.hanlp.seg.Viterbi
-
- com.hankcs.hanlp.seg.Viterbi.Path - 程序包 com.hankcs.hanlp.seg.Viterbi.Path
-
- com.hankcs.hanlp.suggest - 程序包 com.hankcs.hanlp.suggest
-
- com.hankcs.hanlp.suggest.scorer - 程序包 com.hankcs.hanlp.suggest.scorer
-
- com.hankcs.hanlp.suggest.scorer.editdistance - 程序包 com.hankcs.hanlp.suggest.scorer.editdistance
-
- com.hankcs.hanlp.suggest.scorer.lexeme - 程序包 com.hankcs.hanlp.suggest.scorer.lexeme
-
- com.hankcs.hanlp.suggest.scorer.pinyin - 程序包 com.hankcs.hanlp.suggest.scorer.pinyin
-
- com.hankcs.hanlp.summary - 程序包 com.hankcs.hanlp.summary
-
- com.hankcs.hanlp.tokenizer - 程序包 com.hankcs.hanlp.tokenizer
-
一些常用的配置好的静态分词器,其中一些具备特殊的预处理功能
可供用户参考以实现自己的预处理逻辑.
- com.hankcs.hanlp.tokenizer.lexical - 程序包 com.hankcs.hanlp.tokenizer.lexical
-
- com.hankcs.hanlp.tokenizer.pipe - 程序包 com.hankcs.hanlp.tokenizer.pipe
-
- com.hankcs.hanlp.utility - 程序包 com.hankcs.hanlp.utility
-
- combine(String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
-
合并两部词典
- combine(String...) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
-
合并多部词典
- combine(SimpleItem) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
-
合并两个条目,两者的标签map会合并
- combine(SimpleDictionary<V>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SimpleDictionary
-
以我为主词典,合并一个副词典,我有的词条不会被副词典覆盖
- combine(StringDictionary...) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker
-
合并词典,第一个为主词典
- combine(String...) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker
-
- combine(TFDictionary, int, boolean) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TFDictionary
-
合并自己(主词典)和某个词频词典
- combine(String...) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.TFDictionary
-
合并多个词典
- combine(String...) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
-
- combine(Sentence) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
-
- combine(List<Word>) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
-
- combineByCustomDictionary(List<Vertex>) - 类 中的静态方法com.hankcs.hanlp.seg.Segment
-
使用用户词典合并粗分结果
- combineByCustomDictionary(List<Vertex>, DoubleArrayTrie<CoreDictionary.Attribute>) - 类 中的静态方法com.hankcs.hanlp.seg.Segment
-
使用用户词典合并粗分结果
- combineByCustomDictionary(List<Vertex>, WordNet) - 类 中的静态方法com.hankcs.hanlp.seg.Segment
-
使用用户词典合并粗分结果,并将用户词语收集到全词图中
- combineByCustomDictionary(List<Vertex>, DoubleArrayTrie<CoreDictionary.Attribute>, WordNet) - 类 中的静态方法com.hankcs.hanlp.seg.Segment
-
使用用户词典合并粗分结果,并将用户词语收集到全词图中
- combineNER(String[], NERTagSet) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.utility.Utility
-
- combineWhenNotInclude(String[]) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
-
合并,只补充除第一个词典外其他词典的新词
- combineWithCustomDictionary(List<String>) - 类 中的静态方法com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
使用用户词典合并粗分结果
- combineWithNormalization(String[]) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
-
对除第一个之外的词典执行标准化,并且合并
- commit(int, float, int, Configuration) - 接口 中的方法com.hankcs.hanlp.dependency.perceptron.transition.parser.IAction
-
- commitAction(int, int, float, ArrayList<Integer>, Configuration) - 类 中的静态方法com.hankcs.hanlp.dependency.perceptron.transition.parser.ArcEager
-
- CommonAhoCorasickDoubleArrayTrieSegment<V> - com.hankcs.hanlp.seg.Other中的类
-
对CommonAhoCorasickSegmentUtil中最长分词器的包装
- CommonAhoCorasickDoubleArrayTrieSegment(AhoCorasickDoubleArrayTrie<V>) - 类 的构造器com.hankcs.hanlp.seg.Other.CommonAhoCorasickDoubleArrayTrieSegment
-
- CommonAhoCorasickDoubleArrayTrieSegment(TreeMap<String, V>) - 类 的构造器com.hankcs.hanlp.seg.Other.CommonAhoCorasickDoubleArrayTrieSegment
-
- CommonAhoCorasickSegmentUtil - com.hankcs.hanlp.seg.Other中的类
-
一个通用的使用AhoCorasickDoubleArrayTrie实现的最长分词器
- CommonAhoCorasickSegmentUtil() - 类 的构造器com.hankcs.hanlp.seg.Other.CommonAhoCorasickSegmentUtil
-
- CommonDictionary<V> - com.hankcs.hanlp.dictionary.common中的类
-
通用的词典,对应固定格式的词典,但是标签可以泛型化
- CommonDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.common.CommonDictionary
-
- CommonDictionaryMaker - com.hankcs.hanlp.corpus.dictionary中的类
-
- CommonDictionaryMaker(EasyDictionary) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker
-
- commonPrefixSearch(String, int, int) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
-
前缀查询
- commonPrefixSearch(String) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
-
- commonPrefixSearch(byte[], int, int) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DoubleArray
-
Returns the keys that begins with the given key and its corresponding values.
- commonPrefixSearch(String, int) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
查询与query的前缀重合的所有词语
- commonPrefixSearch(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- commonPrefixSearch(String, int, int, int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
前缀查询
- commonPrefixSearch(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
-
前缀查询
- commonPrefixSearch(char[], int) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
-
前缀查询
- commonPrefixSearch(String) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- commonPrefixSearch(String, int, int, int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- commonPrefixSearchWithValue(char[], int) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGMap
-
前缀查询
- commonPrefixSearchWithValue(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGMap
-
前缀查询
- commonPrefixSearchWithValue(String) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
-
前缀查询,包含值
- commonPrefixSearchWithValue(char[], int) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
-
前缀查询,通过字符数组来表示字符串可以优化运行速度
- commonPrefixSearchWithValue(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- commonPrefixSearchWithValue(char[], int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
优化的前缀查询,可以复用字符数组
- CommonStringDictionary - com.hankcs.hanlp.dictionary.common中的类
-
最简单的词典,每一行只有一个词,没别的
- CommonStringDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.common.CommonStringDictionary
-
- CommonSuffixExtractor - com.hankcs.hanlp.corpus.dictionary中的类
-
公共后缀提取工具
- CommonSuffixExtractor() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor
-
- CommonSynonymDictionary - com.hankcs.hanlp.dictionary.common中的类
-
一个没有指定资源位置的通用同义词词典
- CommonSynonymDictionary.SynonymItem - com.hankcs.hanlp.dictionary.common中的类
-
词典中的一个条目
- CommonSynonymDictionaryEx - com.hankcs.hanlp.dictionary.common中的类
-
一个没有指定资源位置的通用同义词词典
- CommonSynonymDictionaryEx.SynonymItem - com.hankcs.hanlp.dictionary.common中的类
-
词典中的一个条目
- CompactArray - com.hankcs.hanlp.dependency.perceptron.structures中的类
-
一个稀疏数组,实际只有一个连续区间被分配内存
- CompactArray(int, float[]) - 类 的构造器com.hankcs.hanlp.dependency.perceptron.structures.CompactArray
-
- CompactTree - com.hankcs.hanlp.dependency.perceptron.transition.configuration中的类
-
- CompactTree(HashMap<Integer, Pair<Integer, String>>, ArrayList<String>) - 类 的构造器com.hankcs.hanlp.dependency.perceptron.transition.configuration.CompactTree
-
- comparator() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrie
-
- compare(Intervalable, Intervalable) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalableComparatorByPosition
-
- compare(Intervalable, Intervalable) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.IntervalableComparatorBySize
-
- compare(Long[], Long[]) - 类 中的静态方法com.hankcs.hanlp.algorithm.ArrayCompare
-
比较数组A与B的大小关系
- compare(String, String) - 类 中的方法com.hankcs.hanlp.seg.common.CWSEvaluator
-
比较标准答案与分词结果
- compareTo(Object) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Interval
-
- compareTo(SString) - 类 中的方法com.hankcs.hanlp.collection.sequence.SString
-
- compareTo(BaseNode) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
-
- compareTo(char) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
-
重载,与字符的比较
- compareTo(BaseNode<V>.TrieEntry) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode.TrieEntry
-
- compareTo(TermFrequency) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.TermFrequency
-
- compareTo(State) - 类 中的方法com.hankcs.hanlp.dependency.common.State
-
- compareTo(AbstractInexactAction) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.action.AbstractInexactAction
-
- compareTo(Object) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.accessories.Pair
-
- compareTo(Object) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.structures.Sentence
-
- compareTo(BeamElement) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.BeamElement
-
- compareTo(Object) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.Configuration
-
- compareTo(Cluster<K>) - 类 中的方法com.hankcs.hanlp.mining.cluster.Cluster
-
- compareTo(VocabWord) - 类 中的方法com.hankcs.hanlp.mining.word2vec.VocabWord
-
- compareTo(State) - 类 中的方法com.hankcs.hanlp.seg.Dijkstra.Path.State
-
- compareTo(QueueElement) - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.QueueElement
-
- compareTo(CharArray) - 类 中的方法com.hankcs.hanlp.suggest.scorer.editdistance.CharArray
-
- compareTo(IdVector) - 类 中的方法com.hankcs.hanlp.suggest.scorer.lexeme.IdVector
-
- compareTo(PinyinKey) - 类 中的方法com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey
-
- compile(String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.dependency.CoNll.PosTagCompiler
-
编译,比如将词性为数词的转为##数##
- compile(IWord) - 类 中的静态方法com.hankcs.hanlp.corpus.util.CorpusUtil
-
编译单词
- compile(Word) - 类 中的静态方法com.hankcs.hanlp.corpus.util.Precompiler
-
将一个单词编译为等效字串
- compile(IWord) - 类 中的静态方法com.hankcs.hanlp.corpus.util.Precompiler
-
- compiledWord - 类 中的变量com.hankcs.hanlp.dependency.common.Node
-
- compileWithoutNS(List<IWord>) - 类 中的静态方法com.hankcs.hanlp.corpus.util.Precompiler
-
在忽略ns的前提下预编译
- compileWithoutNT(List<IWord>) - 类 中的静态方法com.hankcs.hanlp.corpus.util.Precompiler
-
在忽略ns的前提下预编译
- CompoundWord - com.hankcs.hanlp.corpus.document.sentence.word中的类
-
复合词,由两个或以上的word构成
- CompoundWord(List<Word>, String) - 类 的构造器com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
-
- compress(double) - 类 中的方法com.hankcs.hanlp.model.perceptron.model.LinearModel
-
模型压缩
- compress(double, double) - 类 中的方法com.hankcs.hanlp.model.perceptron.model.LinearModel
-
- compute(Graph) - 类 中的静态方法com.hankcs.hanlp.algorithm.Dijkstra
-
- compute(List<CommonSynonymDictionary.SynonymItem>, List<CommonSynonymDictionary.SynonymItem>) - 类 中的静态方法com.hankcs.hanlp.algorithm.EditDistance
-
- compute(long[], long[]) - 类 中的静态方法com.hankcs.hanlp.algorithm.EditDistance
-
- compute(int[], int[]) - 类 中的静态方法com.hankcs.hanlp.algorithm.EditDistance
-
- compute(String, String) - 类 中的静态方法com.hankcs.hanlp.algorithm.EditDistance
-
编辑距离
- compute(char[], char[]) - 类 中的静态方法com.hankcs.hanlp.algorithm.EditDistance
-
编辑距离
- compute(char[], char[]) - 类 中的静态方法com.hankcs.hanlp.algorithm.LongestCommonSubsequence
-
- compute(String, String) - 类 中的静态方法com.hankcs.hanlp.algorithm.LongestCommonSubsequence
-
- compute(char[], char[]) - 类 中的静态方法com.hankcs.hanlp.algorithm.LongestCommonSubstring
-
- compute(String, String) - 类 中的静态方法com.hankcs.hanlp.algorithm.LongestCommonSubstring
-
- compute(int[], int[], double[], double[][], double[][]) - 类 中的静态方法com.hankcs.hanlp.algorithm.Viterbi
-
求解HMM模型,所有概率请提前取对数
- compute(List<Vertex>, TransformMatrix) - 类 中的静态方法com.hankcs.hanlp.algorithm.Viterbi
-
特化版的求解HMM模型
- compute(List<List<IWord>>) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker
-
处理语料,准备词典
- compute() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
输入数据完毕,执行计算
- compute(List<Term>) - 类 中的静态方法com.hankcs.hanlp.dependency.MaxEntDependencyParser
-
已过时。
分析句子的依存句法
- compute(String) - 类 中的静态方法com.hankcs.hanlp.dependency.MaxEntDependencyParser
-
已过时。
分析句子的依存句法
- compute(List<Term>) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.NeuralNetworkDependencyParser
-
分析句子的依存句法
- compute(String) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.NeuralNetworkDependencyParser
-
分析句子的依存句法
- compute(List<Term>) - 类 中的静态方法com.hankcs.hanlp.dependency.WordNatureDependencyParser
-
分析句子的依存句法
- compute(String) - 类 中的静态方法com.hankcs.hanlp.dependency.WordNatureDependencyParser
-
分析句子的依存句法
- compute() - 类 中的方法com.hankcs.hanlp.mining.word.TfIdfCounter
-
- ComputeAccuracy - com.hankcs.hanlp.mining.word2vec中的类
-
- ComputeAccuracy() - 类 的构造器com.hankcs.hanlp.mining.word2vec.ComputeAccuracy
-
- computeAverageDistance(Long[], Long[]) - 类 中的静态方法com.hankcs.hanlp.algorithm.ArrayDistance
-
- computeEnum(List<EnumItem<E>>, TransformMatrixDictionary<E>) - 类 中的静态方法com.hankcs.hanlp.algorithm.Viterbi
-
标准版的Viterbi算法,查准率高,效率稍低
- computeEnumSimply(List<EnumItem<E>>, TransformMatrixDictionary<E>) - 类 中的静态方法com.hankcs.hanlp.algorithm.Viterbi
-
仅仅利用了转移矩阵的“维特比”算法
- computeLeftEntropy(PairFrequency) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
计算左熵
- computeMinimumDistance(TreeSet<Long>, TreeSet<Long>) - 类 中的静态方法com.hankcs.hanlp.algorithm.ArrayDistance
-
- computeMinimumDistance(Long[], Long[]) - 类 中的静态方法com.hankcs.hanlp.algorithm.ArrayDistance
-
- computeMutualInformation(String, String) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
- computeMutualInformation(PairFrequency) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
- computeRightEntropy(PairFrequency) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
计算右熵
- computeScore(LinkedList<double[]>, int) - 类 中的静态方法com.hankcs.hanlp.model.crf.CRFModel
-
给一系列特征函数结合tag打分
- computeScore(String) - 类 中的方法com.hankcs.hanlp.suggest.scorer.BaseScorer
-
- computeScore(String) - 接口 中的方法com.hankcs.hanlp.suggest.scorer.IScorer
-
计算分值
- computeScoreList(Table, int) - 类 中的方法com.hankcs.hanlp.model.crf.CRFModel
-
根据特征函数计算输出
- Config() - 类 的构造器com.hankcs.hanlp.HanLP.Config
-
- Config - com.hankcs.hanlp.mining.word2vec中的类
-
- Config() - 类 的构造器com.hankcs.hanlp.mining.word2vec.Config
-
- config - 类 中的变量com.hankcs.hanlp.mining.word2vec.Corpus
-
- Config - com.hankcs.hanlp.seg中的类
-
分词器配置项
- Config() - 类 的构造器com.hankcs.hanlp.seg.Config
-
- config - 类 中的变量com.hankcs.hanlp.seg.Segment
-
分词器配置
- ConfigOption - com.hankcs.hanlp.dependency.nnparser.option中的类
-
- ConfigOption() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.option.ConfigOption
-
- Configuration - com.hankcs.hanlp.dependency.perceptron.transition.configuration中的类
-
由stack、buffer和arc组成,额外记录了导致该状态的动作历史和分数
- Configuration(Sentence, boolean) - 类 的构造器com.hankcs.hanlp.dependency.perceptron.transition.configuration.Configuration
-
- Configuration(Sentence) - 类 的构造器com.hankcs.hanlp.dependency.perceptron.transition.configuration.Configuration
-
- confirmNature(Nature) - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
-
将属性的词性锁定为nature
- confirmNature(Nature, boolean) - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
-
将属性的词性锁定为nature,此重载会降低性能
- CoNLLFixer - com.hankcs.hanlp.corpus.dependency.CoNll中的类
-
修正一些非10行的依存语料
- CoNLLFixer() - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLFixer
-
- CoNllLine - com.hankcs.hanlp.corpus.dependency.CoNll中的类
-
CoNLL语料中的一行
- CoNllLine(String...) - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNllLine
-
- CoNLLLoader - com.hankcs.hanlp.corpus.dependency.CoNll中的类
-
CoNLL格式依存语料加载
- CoNLLLoader() - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLLoader
-
- CoNLLReader - com.hankcs.hanlp.dependency.perceptron.accessories中的类
-
- CoNLLReader(String) - 类 的构造器com.hankcs.hanlp.dependency.perceptron.accessories.CoNLLReader
-
Initializes the file reader
- CoNLLSentence - com.hankcs.hanlp.corpus.dependency.CoNll中的类
-
CoNLL中的一个句子
- CoNLLSentence(List<CoNllLine>) - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence
-
构造一个句子
- CoNLLSentence(CoNLLWord[]) - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence
-
- CoNLLWord - com.hankcs.hanlp.corpus.dependency.CoNll中的类
-
- CoNLLWord(int, String, String) - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
-
- CoNLLWord(int, String, String, String) - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
-
- CoNLLWord(CoNllLine) - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
-
- CoNLLWord(CoNllLine[], int) - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
-
- connect(int, int, double) - 类 中的方法com.hankcs.hanlp.seg.common.Graph
-
连接两个节点
- ConsoleLogger - com.hankcs.hanlp.classification.utilities.io中的类
-
输出到stdout和stderr的日志系统
- ConsoleLogger() - 类 的构造器com.hankcs.hanlp.classification.utilities.io.ConsoleLogger
-
- constructWithCopy(double[][]) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Construct a matrix from a copy of a 2-D array.
- contains(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
-
是否包含
Determines whether a String is present in the MDAG.
- contains(Object) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
-
- contains(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.EasyDictionary
-
- contains(String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonDictionary
-
是否含有键
- contains(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreDictionary
-
是否包含词语
- contains(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
-
词典中是否含有词语
- contains(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary
-
- contains(Object) - 类 中的方法com.hankcs.hanlp.mining.word.TermFrequencyCounter
-
- contains(String) - 类 中的方法com.hankcs.hanlp.model.perceptron.tagset.TagSet
-
- contains(Object) - 类 中的方法com.hankcs.hanlp.seg.SegmentPipeline
-
- contains(Object) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.Pipeline
-
- contains(String) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
-
词库是否收录了词语(查询核心词典和用户词典)
- containsAll(Collection<?>) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
-
- containsAll(Collection<?>) - 类 中的方法com.hankcs.hanlp.mining.word.TermFrequencyCounter
-
- containsAll(Collection<?>) - 类 中的方法com.hankcs.hanlp.seg.SegmentPipeline
-
- containsAll(Collection<?>) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.Pipeline
-
- containsKey(Object) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
-
- containsKey(String) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
-
是否包含key
- containsKey(String) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
-
- containsKey(Object) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrie
-
- containsKey(String) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
- containsKey(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- containsKey(String) - 接口 中的方法com.hankcs.hanlp.collection.trie.ITrie
-
- containsKey(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary
-
是否包含key
- containsKey(String, int) - 类 中的静态方法com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary
-
包含key,且key至少长length
- containsKey(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.nr.TranslatedPersonDictionary
-
是否包含key
- containsKey(String, int) - 类 中的静态方法com.hankcs.hanlp.dictionary.nr.TranslatedPersonDictionary
-
时报包含key,且key至少长length
- containsLabel(E) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.EnumItem
-
- containsLabel(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
-
- containsValue(Object) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
-
- containsValue(Object) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrie
-
- containsWordWithLabel(String) - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.Sentence
-
是否含有词性为label的单词
- Context - com.hankcs.hanlp.dependency.nnparser中的类
-
上下文
- Context() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Context
-
- Context - com.hankcs.hanlp.model.maxent中的类
-
将参数与特征关联起来的类,用来储存最大熵的参数,也用来储存模型和经验分布
- Context(int[], double[]) - 类 的构造器com.hankcs.hanlp.model.maxent.Context
-
构建一个新的上下文
- ContinuousDistributions - com.hankcs.hanlp.classification.statistics中的类
-
提供常见连续分布的概率密度函数和累积分布函数计算
- ContinuousDistributions() - 类 的构造器com.hankcs.hanlp.classification.statistics.ContinuousDistributions
-
- convert(String, String) - 类 中的方法com.hankcs.hanlp.classification.corpus.AbstractDataSet
-
- convert(String, String) - 接口 中的方法com.hankcs.hanlp.classification.corpus.IDataSet
-
利用本数据集的词表和类目表将文本形式的文档转换为内部通用的文档
- convert(List<Term>, boolean) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionary
-
将分词结果转换为同义词列表
- convert(List<Term>, boolean) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx
-
将分词结果转换为同义词列表
- CONVERT - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharTable
-
正规化使用的对应表
- convert(char) - 类 中的静态方法com.hankcs.hanlp.dictionary.other.CharTable
-
将一个字符正规化
- convert(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.other.CharTable
-
- convert(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.other.CharTable
-
- convert(String, char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.other.CharTable
-
- convert(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.String2PinyinConverter
-
文本转拼音
- convert(String, boolean) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.String2PinyinConverter
-
文本转拼音
- convert(String[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter
-
- convert(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter
-
- convert(String, boolean) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter
-
- convert(String) - 类 中的方法com.hankcs.hanlp.dictionary.TransformMatrixDictionary
-
- convert - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.crf_learn.Option
-
- convert(String, String) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DecoderFeatureIndex
-
- convert(String, String) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.EncoderFeatureIndex
-
- convert(String, int) - 类 中的静态方法com.hankcs.hanlp.seg.NShort.Path.AtomNode
-
- convert(List<Vertex>, boolean) - 类 中的静态方法com.hankcs.hanlp.seg.Segment
-
将一条路径转为最终结果
- convert(List<Vertex>) - 类 中的静态方法com.hankcs.hanlp.seg.WordBasedSegment
-
将一条路径转为最终结果
- convert2Array(String, boolean) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.String2PinyinConverter
-
将拼音文本转化为完整的拼音,支持汉英混合的杂乱文本,注意如果混用拼音和输入法头的话,并不会有多高的准确率,声调也不会准的
- convert2CompatibleList(List<List<Word>>) - 类 中的静态方法com.hankcs.hanlp.corpus.util.CorpusUtil
-
将word列表转为兼容的IWord列表
- convert2Document(File) - 类 中的静态方法com.hankcs.hanlp.corpus.document.CorpusLoader
-
- convert2DocumentList(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.CorpusLoader
-
- convert2DocumentList(String, boolean) - 类 中的静态方法com.hankcs.hanlp.corpus.document.CorpusLoader
-
读取整个目录中的人民日报格式语料
- convert2Pair(String, boolean) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.String2PinyinConverter
-
将混合文本转为拼音
- convert2SentenceList(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.CorpusLoader
-
- convert2SimpleSentenceList(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.CorpusLoader
-
- convert2Tone5(Pinyin) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.String2PinyinConverter
-
将拼音的音调统统转为5调或者最大的音调
- convert_to_text - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.crf_learn.Option
-
- convertCorpus(Sentence, BufferedWriter) - 类 中的方法com.hankcs.hanlp.model.crf.CRFNERecognizer
-
- convertCorpus(Sentence, BufferedWriter) - 类 中的方法com.hankcs.hanlp.model.crf.CRFPOSTagger
-
- convertCorpus(Sentence, BufferedWriter) - 类 中的方法com.hankcs.hanlp.model.crf.CRFSegmenter
-
- convertCorpus(Sentence, BufferedWriter) - 类 中的方法com.hankcs.hanlp.model.crf.CRFTagger
-
- convertCorpus(String, String) - 类 中的方法com.hankcs.hanlp.model.crf.CRFTagger
-
- convertFromToneNumber(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter
-
- convertFromToneNumber(String[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter
-
- convertId2String(long) - 类 中的静态方法com.hankcs.hanlp.corpus.synonym.SynonymHelper
-
- convertId2StringWithIndex(long) - 类 中的静态方法com.hankcs.hanlp.corpus.synonym.SynonymHelper
-
- convertIntToTwoChar(int) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
-
- convertList2Array(List<Pinyin>) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinUtil
-
将列表转为数组
- convertPinyinList2TonePinyinList(List<Pinyin>) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinUtil
-
转换List
pinyinList到List,其中的String为带声调符号形式
- convertPKUtoCWS(String, String, int, int) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.utility.Utility
-
将人民日报格式的分词语料转化为空格分割的语料
- convertPKUtoPOS(String, String, int, int) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.utility.Utility
-
将人民日报格式的分词语料转化为空格分割的语料
- convertSentenceToNER(Sentence, NERTagSet) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.utility.Utility
-
将句子转换为 (单词,词性,NER标签)三元组
- convertSingle(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.String2PinyinConverter
-
将单个音节转为拼音
- convertString2Id(String) - 类 中的静态方法com.hankcs.hanlp.corpus.synonym.SynonymHelper
-
- convertString2IdWithIndex(String, long) - 类 中的静态方法com.hankcs.hanlp.corpus.synonym.SynonymHelper
-
- convertString2IdWithIndex(String, int) - 类 中的静态方法com.hankcs.hanlp.corpus.synonym.SynonymHelper
-
- convertStringToNature(String, LinkedHashSet<Nature>) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
-
将字符串词性转为Enum词性
- convertStringToNature(String) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
-
将字符串词性转为Enum词性
- convertToHongKongTraditionalChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TraditionalToHongKongChineseDictionary
-
- convertToHongKongTraditionalChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TraditionalToHongKongChineseDictionary
-
- convertToneNumber2ToneMark(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinUtil
-
Convert tone numbers to tone marks using Unicode
Algorithm for determining location of tone mark
A simple algorithm for determining the vowel on which the tone mark
appears is as follows:
First, look for an "a" or an "e".
- convertToPinyin(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinDictionary
-
转为拼音
- convertToPinyin(String, boolean) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinDictionary
-
- convertToPinyinArray(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinDictionary
-
转为拼音
- convertToPinyinFirstCharString(String, String, boolean) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
转化为拼音(首字母)
- convertToPinyinList(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
转化为拼音
- convertToPinyinString(String, String, boolean) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
转化为拼音
- convertToSequence(Sentence) - 类 中的方法com.hankcs.hanlp.model.hmm.HMMNERecognizer
-
- convertToSequence(Sentence) - 类 中的方法com.hankcs.hanlp.model.hmm.HMMPOSTagger
-
- convertToSequence(Sentence) - 类 中的方法com.hankcs.hanlp.model.hmm.HMMSegmenter
-
- convertToSequence(Sentence) - 类 中的方法com.hankcs.hanlp.model.hmm.HMMTrainer
-
- convertToSimplifiedChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.HongKongToSimplifiedChineseDictionary
-
- convertToSimplifiedChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.HongKongToSimplifiedChineseDictionary
-
- convertToSimplifiedChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TaiwanToSimplifiedChineseDictionary
-
- convertToSimplifiedChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TaiwanToSimplifiedChineseDictionary
-
- convertToSimplifiedChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TraditionalChineseDictionary
-
- convertToSimplifiedChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TraditionalChineseDictionary
-
- convertToSimplifiedChinese(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
繁转简
- convertToTaiwanChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TraditionalToTaiwanChineseDictionary
-
- convertToTaiwanChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TraditionalToTaiwanChineseDictionary
-
- convertToTraditionalChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.HongKongToTraditionalChineseDictionary
-
- convertToTraditionalChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.HongKongToTraditionalChineseDictionary
-
- convertToTraditionalChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.SimplifiedChineseDictionary
-
- convertToTraditionalChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.SimplifiedChineseDictionary
-
- convertToTraditionalChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TaiwanToTraditionalChineseDictionary
-
- convertToTraditionalChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TaiwanToTraditionalChineseDictionary
-
- convertToTraditionalChinese(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
简转繁
- convertToTraditionalHongKongChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.SimplifiedToHongKongChineseDictionary
-
- convertToTraditionalHongKongChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.SimplifiedToHongKongChineseDictionary
-
- convertToTraditionalHongKongChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TaiwanToHongKongChineseDictionary
-
- convertToTraditionalHongKongChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.TaiwanToHongKongChineseDictionary
-
- convertToTraditionalTaiwanChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.HongKongToTaiwanChineseDictionary
-
- convertToTraditionalTaiwanChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.HongKongToTaiwanChineseDictionary
-
- convertToTraditionalTaiwanChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.SimplifiedToTaiwanChineseDictionary
-
- convertToTraditionalTaiwanChinese(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.SimplifiedToTaiwanChineseDictionary
-
- convertTwoCharToInt(char, char) - 类 中的静态方法com.hankcs.hanlp.utility.ByteUtil
-
- copy() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.details.DoubleArrayBuilder
-
- copy() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Make a deep copy of a matrix
- copy() - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
-
复制自己
- CoreBiGramTableDictionary - com.hankcs.hanlp.dictionary中的类
-
核心词典的二元接续词典,采用整型储存,高性能
- CoreBiGramTableDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary
-
- CoreDictionary - com.hankcs.hanlp.dictionary中的类
-
使用DoubleArrayTrie实现的核心词典
- CoreDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.CoreDictionary
-
- CoreDictionary.Attribute - com.hankcs.hanlp.dictionary中的类
-
核心词典中的词属性
- CoreDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
-
核心词典路径
- CoreDictionaryTransformMatrixDictionary - com.hankcs.hanlp.dictionary中的类
-
核心词典词性转移矩阵
- CoreDictionaryTransformMatrixDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.CoreDictionaryTransformMatrixDictionary
-
- CoreDictionaryTransformMatrixDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
-
核心词典词性转移矩阵路径
- CoreStopWordDictionary - com.hankcs.hanlp.dictionary.stopword中的类
-
核心停用词词典
- CoreStopWordDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary
-
- CoreStopWordDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
-
停用词词典路径
- CoreSynonymDictionary - com.hankcs.hanlp.dictionary中的类
-
核心同义词词典
- CoreSynonymDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.CoreSynonymDictionary
-
- CoreSynonymDictionaryDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
-
同义词词典路径
- CoreSynonymDictionaryEx - com.hankcs.hanlp.dictionary中的类
-
核心同义词词典(使用语义id作为value)
- CoreSynonymDictionaryEx() - 类 的构造器com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx
-
- Corpus - com.hankcs.hanlp.mining.word2vec中的类
-
- Corpus(Config) - 类 的构造器com.hankcs.hanlp.mining.word2vec.Corpus
-
- Corpus(Corpus) - 类 的构造器com.hankcs.hanlp.mining.word2vec.Corpus
-
- corpusLoaded(int, int, int) - 接口 中的方法com.hankcs.hanlp.mining.word2vec.TrainingCallback
-
语料加载完毕
- CorpusLoader - com.hankcs.hanlp.corpus.document中的类
-
- CorpusLoader() - 类 的构造器com.hankcs.hanlp.corpus.document.CorpusLoader
-
- CorpusLoader.Handler - com.hankcs.hanlp.corpus.document中的接口
-
- CorpusLoader.HandlerThread - com.hankcs.hanlp.corpus.document中的类
-
多线程任务
- corpusLoading(float) - 接口 中的方法com.hankcs.hanlp.mining.word2vec.TrainingCallback
-
语料加载中
- CorpusUtil - com.hankcs.hanlp.corpus.util中的类
-
- CorpusUtil() - 类 的构造器com.hankcs.hanlp.corpus.util.CorpusUtil
-
- cosine(Vector) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Vector
-
夹角的余弦
- cosineForUnitVector(Vector) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Vector
-
夹角的余弦
认为this和other都是单位向量,所以方法内部没有除以两者的模。
- cost - 类 中的变量com.hankcs.hanlp.dependency.common.Edge
-
- cost - 类 中的变量com.hankcs.hanlp.dependency.common.State
-
- cost - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.crf_learn.Option
-
- cost - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.Node
-
- cost - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.Path
-
- cost - 类 中的变量com.hankcs.hanlp.seg.Dijkstra.Path.State
-
路径花费
- costFactor() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- costFactor_ - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- count(String, String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
-
统计 keyword 在 srcText 中的出现次数
- CPOSTAG - 类 中的变量com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
-
当前词语的词性(粗粒度)
- CQueue - com.hankcs.hanlp.seg.NShort.Path中的类
-
一个维护了上次访问位置的优先级队列(最小堆)
- CQueue() - 类 的构造器com.hankcs.hanlp.seg.NShort.Path.CQueue
-
- create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.EasyDictionary
-
- create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.item.EnumItem
-
- create(String[]) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.item.EnumItem
-
- create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.item.Item
-
- create(String[]) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.item.Item
-
- create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
-
- create(String[]) - 类 中的静态方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
-
- create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.Document
-
- create(File) - 类 中的静态方法com.hankcs.hanlp.corpus.document.Document
-
- create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.sentence.Sentence
-
以人民日报2014语料格式的字符串创建一个结构化句子
- create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
-
- create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.sentence.word.Word
-
通过参数构造一个单词
- create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.sentence.word.WordFactory
-
根据参数字符串产生对应的词语
- create(String) - 类 中的方法com.hankcs.hanlp.corpus.io.FileIOAdapter
-
- create(String) - 接口 中的方法com.hankcs.hanlp.corpus.io.IIOAdapter
-
创建一个新文件以供输出
- create(String) - 类 中的方法com.hankcs.hanlp.corpus.io.ResourceIOAdapter
-
- create(String, char, String) - 类 中的静态方法com.hankcs.hanlp.corpus.occurrence.PairFrequency
-
构造一个pf
- create(String, char, String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.occurrence.TriaFrequency
-
构造一个三阶接续,正向
- create(String, String, char, String) - 类 中的静态方法com.hankcs.hanlp.corpus.occurrence.TriaFrequency
-
构造一个三阶接续,逆向
- create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.synonym.Synonym
-
通过类似 Bh06A32= 番茄 西红柿 的字符串构造一系列同义词
- create(String[]) - 类 中的静态方法com.hankcs.hanlp.corpus.synonym.Synonym
-
- create(String) - 类 中的静态方法com.hankcs.hanlp.corpus.tag.Nature
-
创建自定义词性,如果已有该对应词性,则直接返回已有的词性
- create(int, E) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.util.std
-
- create(InputStream) - 类 中的静态方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary
-
- create(InputStream) - 类 中的静态方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx
-
- create(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
-
- create(ByteArray, Nature[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
-
从字节流中加载
- create(String) - 类 中的静态方法com.hankcs.hanlp.model.crf.FeatureTemplate
-
- create(String) - 类 中的静态方法com.hankcs.hanlp.model.maxent.MaxEntModel
-
从文件加载,同时缓存为二进制文件
- create(ByteArray) - 类 中的静态方法com.hankcs.hanlp.model.maxent.MaxEntModel
-
从字节流快速加载
- create(Sentence, FeatureMap) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.instance.CWSInstance
-
- create(String, FeatureMap) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.instance.NERInstance
-
- create(Sentence, FeatureMap) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.instance.NERInstance
-
- create(String, FeatureMap) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.instance.POSInstance
-
- create(Sentence, FeatureMap) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.instance.POSInstance
-
- createByteArray(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.ByteArray
-
从文件读取一个字节数组
- createByteArrayFileStream(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.ByteArrayFileStream
-
- createByteArrayFileStream(FileInputStream) - 类 中的静态方法com.hankcs.hanlp.corpus.io.ByteArrayFileStream
-
- createByteArrayOtherStream(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.ByteArrayOtherStream
-
- createByteArrayOtherStream(InputStream) - 类 中的静态方法com.hankcs.hanlp.corpus.io.ByteArrayOtherStream
-
- createByteArrayStream(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.ByteArrayStream
-
- createIndices(String, boolean, boolean, String) - 类 中的静态方法com.hankcs.hanlp.dependency.perceptron.accessories.CoNLLReader
-
读取CoNLL文件,创建索引
- createInstance(Sentence, FeatureMap) - 类 中的方法com.hankcs.hanlp.model.perceptron.CWSTrainer
-
- createInstance(Sentence, FeatureMap) - 类 中的方法com.hankcs.hanlp.model.perceptron.InstanceConsumer
-
- createInstance(Sentence, FeatureMap) - 类 中的方法com.hankcs.hanlp.model.perceptron.NERTrainer
-
- createInstance(Sentence, FeatureMap) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronNERecognizer
-
- createInstance(Sentence, FeatureMap) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronPOSTagger
-
- createInstance(Sentence, FeatureMap) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronSegmenter
-
- createInstance(Sentence, FeatureMap) - 类 中的方法com.hankcs.hanlp.model.perceptron.POSTrainer
-
- createTagger() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Model
-
- createTagger() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.ModelImpl
-
- createTagSet() - 类 中的方法com.hankcs.hanlp.model.perceptron.CWSTrainer
-
- createTagSet() - 类 中的方法com.hankcs.hanlp.model.perceptron.NERTrainer
-
重载此方法以支持任意自定义NER类型,例如:
NERTagSet tagSet = new NERTagSet();
tagSet.nerLabels.add("nr");
tagSet.nerLabels.add("ns");
tagSet.nerLabels.add("nt");
return tagSet;
- createTagSet() - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronTrainer
-
创建标注集
- createTagSet() - 类 中的方法com.hankcs.hanlp.model.perceptron.POSTrainer
-
- createUndefined(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem
-
创建一个@类型的词典之外的条目
- createValue(String[]) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonDictionary
-
从一行词典条目创建值
- createValue(String[]) - 类 中的方法com.hankcs.hanlp.dictionary.common.EnumItemDictionary
-
- createValue(Class<?>, String) - 接口 中的方法com.hankcs.hanlp.model.perceptron.cli.Args.ValueCreator
-
Creates a value object of the given type using the given string value representation;
- crf_learn - com.hankcs.hanlp.model.crf.crfpp中的类
-
对应crf_learn
- crf_learn() - 类 的构造器com.hankcs.hanlp.model.crf.crfpp.crf_learn
-
- crf_learn.Option - com.hankcs.hanlp.model.crf.crfpp中的类
-
- crf_test - com.hankcs.hanlp.model.crf.crfpp中的类
-
对应crf_test
- crf_test() - 类 的构造器com.hankcs.hanlp.model.crf.crfpp.crf_test
-
- CRFCWSModelPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
-
CRF分词模型
- CRFEncoderThread - com.hankcs.hanlp.model.crf.crfpp中的类
-
- CRFEncoderThread(int) - 类 的构造器com.hankcs.hanlp.model.crf.crfpp.CRFEncoderThread
-
- CRFLexicalAnalyzer - com.hankcs.hanlp.model.crf中的类
-
CRF词法分析器(中文分词、词性标注和命名实体识别)
- CRFLexicalAnalyzer(CRFSegmenter) - 类 的构造器com.hankcs.hanlp.model.crf.CRFLexicalAnalyzer
-
构造CRF词法分析器
- CRFLexicalAnalyzer(CRFSegmenter, CRFPOSTagger) - 类 的构造器com.hankcs.hanlp.model.crf.CRFLexicalAnalyzer
-
构造CRF词法分析器
- CRFLexicalAnalyzer(CRFSegmenter, CRFPOSTagger, CRFNERecognizer) - 类 的构造器com.hankcs.hanlp.model.crf.CRFLexicalAnalyzer
-
构造CRF词法分析器
- CRFLexicalAnalyzer(String) - 类 的构造器com.hankcs.hanlp.model.crf.CRFLexicalAnalyzer
-
构造CRF词法分析器
- CRFLexicalAnalyzer(String, String) - 类 的构造器com.hankcs.hanlp.model.crf.CRFLexicalAnalyzer
-
构造CRF词法分析器
- CRFLexicalAnalyzer(String, String, String) - 类 的构造器com.hankcs.hanlp.model.crf.CRFLexicalAnalyzer
-
构造CRF词法分析器
- CRFLexicalAnalyzer() - 类 的构造器com.hankcs.hanlp.model.crf.CRFLexicalAnalyzer
-
加载配置文件指定的模型
- CRFModel - com.hankcs.hanlp.model.crf中的类
-
这份代码目前做到了与CRF++解码结果完全一致。
- CRFModel() - 类 的构造器com.hankcs.hanlp.model.crf.CRFModel
-
- CRFModel(ITrie<FeatureFunction>) - 类 的构造器com.hankcs.hanlp.model.crf.CRFModel
-
以指定的trie树结构储存内部特征函数
- CRFNERecognizer - com.hankcs.hanlp.model.crf中的类
-
- CRFNERecognizer() - 类 的构造器com.hankcs.hanlp.model.crf.CRFNERecognizer
-
- CRFNERecognizer(String) - 类 的构造器com.hankcs.hanlp.model.crf.CRFNERecognizer
-
- CRFNERecognizer(String, String[]) - 类 的构造器com.hankcs.hanlp.model.crf.CRFNERecognizer
-
- CRFNERModelPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
-
CRF命名实体识别模型
- CRFPOSModelPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
-
CRF词性标注模型
- CRFPOSTagger - com.hankcs.hanlp.model.crf中的类
-
- CRFPOSTagger() - 类 的构造器com.hankcs.hanlp.model.crf.CRFPOSTagger
-
- CRFPOSTagger(String) - 类 的构造器com.hankcs.hanlp.model.crf.CRFPOSTagger
-
- CRFSegment - com.hankcs.hanlp.seg.CRF中的类
-
- CRFSegment(CRFSegmentModel) - 类 的构造器com.hankcs.hanlp.seg.CRF.CRFSegment
-
已过时。
- CRFSegment(String) - 类 的构造器com.hankcs.hanlp.seg.CRF.CRFSegment
-
已过时。
- CRFSegment() - 类 的构造器com.hankcs.hanlp.seg.CRF.CRFSegment
-
已过时。
- CRFSegmenter - com.hankcs.hanlp.model.crf中的类
-
- CRFSegmenter() - 类 的构造器com.hankcs.hanlp.model.crf.CRFSegmenter
-
- CRFSegmenter(String) - 类 的构造器com.hankcs.hanlp.model.crf.CRFSegmenter
-
- CRFSegmentModel - com.hankcs.hanlp.model中的类
-
静态CRF分词模型
- CRFSegmentModel(ITrie<FeatureFunction>) - 类 的构造器com.hankcs.hanlp.model.CRFSegmentModel
-
以指定的trie树结构储存内部特征函数
- CRFSegmentModelPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
-
- CRFTagger - com.hankcs.hanlp.model.crf中的类
-
- CRFTagger() - 类 的构造器com.hankcs.hanlp.model.crf.CRFTagger
-
- CRFTagger(String) - 类 的构造器com.hankcs.hanlp.model.crf.CRFTagger
-
- CT_CHINESE - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharType
-
中文字符
- CT_CNUM - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharType
-
中文数字
- CT_DELIMITER - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharType
-
分隔符"!
- CT_INDEX - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharType
-
序号
- CT_LETTER - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharType
-
字母
- CT_NUM - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharType
-
数字
- CT_OTHER - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharType
-
其他
- CT_SINGLE - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharType
-
单字节
- cube() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
返回矩阵的立方(以数组形式)
- CustomDictionary - com.hankcs.hanlp.dictionary中的类
-
用户自定义词典
注意自定义词典的动态增删改不是线程安全的。
- CustomDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.CustomDictionary
-
- CustomDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
-
用户自定义词典路径
- CWSEvaluator - com.hankcs.hanlp.seg.common中的类
-
中文分词评测工具
- CWSEvaluator() - 类 的构造器com.hankcs.hanlp.seg.common.CWSEvaluator
-
- CWSEvaluator(Set<String>) - 类 的构造器com.hankcs.hanlp.seg.common.CWSEvaluator
-
- CWSEvaluator(String) - 类 的构造器com.hankcs.hanlp.seg.common.CWSEvaluator
-
- CWSEvaluator.Result - com.hankcs.hanlp.seg.common中的类
-
- CWSInstance - com.hankcs.hanlp.model.perceptron.instance中的类
-
- CWSInstance(String[], FeatureMap) - 类 的构造器com.hankcs.hanlp.model.perceptron.instance.CWSInstance
-
生成分词实例
- CWSInstance(String, FeatureMap) - 类 的构造器com.hankcs.hanlp.model.perceptron.instance.CWSInstance
-
- CWSTagSet - com.hankcs.hanlp.model.perceptron.tagset中的类
-
- CWSTagSet(int, int, int, int) - 类 的构造器com.hankcs.hanlp.model.perceptron.tagset.CWSTagSet
-
- CWSTagSet() - 类 的构造器com.hankcs.hanlp.model.perceptron.tagset.CWSTagSet
-
- CWSTrainer - com.hankcs.hanlp.model.perceptron中的类
-
感知机分词器训练工具
- CWSTrainer() - 类 的构造器com.hankcs.hanlp.model.perceptron.CWSTrainer
-
- e - 类 中的变量com.hankcs.hanlp.collection.sequence.SString
-
结束位置,不包含
- e(CoNLLSentence, CoNLLSentence) - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator
-
- e - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
叹词
- E - 类 中的变量com.hankcs.hanlp.model.perceptron.tagset.CWSTagSet
-
- E_TAG_PREFIX - 类 中的变量com.hankcs.hanlp.model.perceptron.tagset.NERTagSet
-
- EasyDictionary - com.hankcs.hanlp.corpus.dictionary中的类
-
一个通用的、满足特定格式的双数组词典
- EasyDictionary() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.EasyDictionary
-
- EasyDictionary.Attribute - com.hankcs.hanlp.corpus.dictionary中的类
-
通用词典中的词属性
- EasyDictionary.Searcher - com.hankcs.hanlp.corpus.dictionary中的类
-
- EasyReader - com.hankcs.hanlp.corpus.io中的类
-
文本读取工具
- EasyReader(String) - 类 的构造器com.hankcs.hanlp.corpus.io.EasyReader
-
构造
- EasyReader(String, boolean) - 类 的构造器com.hankcs.hanlp.corpus.io.EasyReader
-
构造
- ed(String, String) - 类 中的静态方法com.hankcs.hanlp.algorithm.EditDistance
-
编辑距离
- Edge - com.hankcs.hanlp.dependency.common中的类
-
一条边
- Edge(int, int, String, float) - 类 的构造器com.hankcs.hanlp.dependency.common.Edge
-
- edge - 类 中的变量com.hankcs.hanlp.dependency.common.State
-
- Edge - com.hankcs.hanlp.dependency.perceptron.accessories中的类
-
依存句法树上的一条边
- Edge(int, int) - 类 的构造器com.hankcs.hanlp.dependency.perceptron.accessories.Edge
-
- Edge - com.hankcs.hanlp.seg.common中的类
-
基础边,不允许构造
- Edge(double, String) - 类 的构造器com.hankcs.hanlp.seg.common.Edge
-
- EdgeFrom - com.hankcs.hanlp.seg.common中的类
-
记录了起点的边
- EdgeFrom(int, double, String) - 类 的构造器com.hankcs.hanlp.seg.common.EdgeFrom
-
- edgesTo - 类 中的变量com.hankcs.hanlp.seg.common.Graph
-
边,到达下标i
- EditDistance - com.hankcs.hanlp.algorithm中的类
-
基于语义距离的编辑距离实现
- EditDistance() - 类 的构造器com.hankcs.hanlp.algorithm.EditDistance
-
- EditDistanceScorer - com.hankcs.hanlp.suggest.scorer.editdistance中的类
-
编辑距离打分器
- EditDistanceScorer() - 类 的构造器com.hankcs.hanlp.suggest.scorer.editdistance.EditDistanceScorer
-
- effectiveLaSize() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.learning.AveragedPerceptron
-
- effectiveRaSize() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.learning.AveragedPerceptron
-
- embedding_size - 类 中的变量com.hankcs.hanlp.dependency.nnparser.option.LearnOption
-
- emissionCost(int, int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Tagger
-
- emissionCost(int, int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- emissionVector(int, int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Tagger
-
- emissionVector(int, int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- Emit - com.hankcs.hanlp.algorithm.ahocorasick.trie中的类
-
一个模式串匹配结果
- Emit(int, int, String) - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.Emit
-
构造一个模式串匹配结果
- emit() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
-
获取这个节点代表的模式串(们)
- emit() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
-
获取这个节点代表的模式串(们)
- empty() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Tagger
-
- empty() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- emptyFlag - 类 中的变量com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
This is the additional information for the case of parsing with tree constraint
For more information see:
Joakim Nivre and Daniel Fernández-González.
- enableAllNamedEntityRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.NShort.NShortSegment
-
- enableAllNamedEntityRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
是否启用所有的命名实体识别
- enableCustomDictionary(boolean) - 类 中的方法com.hankcs.hanlp.seg.DictionaryBasedSegment
-
- enableCustomDictionary(boolean) - 类 中的方法com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment
-
- enableCustomDictionary(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
是否启用用户词典
- enableCustomDictionaryForcing(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
是否尽可能强制使用用户词典(使用户词典的优先级尽可能高)
警告:具体实现由各子类决定,可能会破坏分词器的统计特性(例如,如果用户词典
含有“和服”,则“商品和服务”的分词结果可能会被用户词典的高优先级影响)。
- enableDebug() - 类 中的静态方法com.hankcs.hanlp.HanLP.Config
-
开启调试模式(会降低性能)
- enableDebug(boolean) - 类 中的静态方法com.hankcs.hanlp.HanLP.Config
-
开启调试模式(会降低性能)
- enableDeprelTranslator(boolean) - 类 中的方法com.hankcs.hanlp.dependency.AbstractDependencyParser
-
- enableDeprelTranslator(boolean) - 接口 中的方法com.hankcs.hanlp.dependency.IDependencyParser
-
依存关系自动转换开关
- enableIndexMode(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
设为索引模式
- enableIndexMode(int) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
索引模式下的最小切分颗粒度(设为1可以最小切分为单字)
- enableJapaneseNameRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.NShort.NShortSegment
-
是否启用日本人名识别
- enableJapaneseNameRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
是否启用日本人名识别
- enableMultithreading(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
开启多线程
- enableMultithreading(int) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
开启多线程
- enableNameRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
开启人名识别
- enableNumberQuantifierRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.CRF.CRFSegment
-
已过时。
- enableNumberQuantifierRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
是否启用数词和数量词识别
即[二, 十, 一] => [二十一],[十, 九, 元] => [十九元]
- enableOffset(boolean) - 类 中的方法com.hankcs.hanlp.seg.NShort.NShortSegment
-
是否启用偏移量计算(开启后Term.offset才会被计算)
- enableOffset(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
是否启用偏移量计算(开启后Term.offset才会被计算)
- enableOrganizationRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.NShort.NShortSegment
-
开启机构名识别
- enableOrganizationRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
开启机构名识别
- enablePartOfSpeechTagging(boolean) - 类 中的方法com.hankcs.hanlp.seg.DictionaryBasedSegment
-
开启数词和英文识别(与标准意义上的词性标注不同,只是借用这个配置方法,不是真的开启了词性标注。
- enablePartOfSpeechTagging(boolean) - 类 中的方法com.hankcs.hanlp.seg.NShort.NShortSegment
-
开启词性标注
- enablePartOfSpeechTagging(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
开启词性标注
- enablePlaceRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.NShort.NShortSegment
-
开启地名识别
- enablePlaceRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
开启地名识别
- enableProbability(boolean) - 类 中的方法com.hankcs.hanlp.classification.classifiers.AbstractClassifier
-
- enableProbability(boolean) - 接口 中的方法com.hankcs.hanlp.classification.classifiers.IClassifier
-
是否归一化分值为概率
- enableRuleBasedSegment - 类 中的变量com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
是否执行规则分词(英文数字标点等的规则预处理)。
- enableRuleBasedSegment(boolean) - 类 中的方法com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
是否执行规则分词(英文数字标点等的规则预处理)。
- enableTranslatedNameRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.NShort.NShortSegment
-
是否启用音译人名识别
- enableTranslatedNameRecognize(boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
是否启用音译人名识别
- Encoder - com.hankcs.hanlp.model.crf.crfpp中的类
-
训练入口
- Encoder() - 类 的构造器com.hankcs.hanlp.model.crf.crfpp.Encoder
-
- Encoder.Algorithm - com.hankcs.hanlp.model.crf.crfpp中的枚举
-
- EncoderFeatureIndex - com.hankcs.hanlp.model.crf.crfpp中的类
-
- EncoderFeatureIndex(int) - 类 的构造器com.hankcs.hanlp.model.crf.crfpp.EncoderFeatureIndex
-
- encoding - 类 中的变量com.hankcs.hanlp.mining.word2vec.Corpus
-
- ENCODING - 类 中的变量com.hankcs.hanlp.mining.word2vec.VectorsReader
-
- end - 类 中的变量com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit
-
模式串在母文本中的终止位置
- end - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
仅用于终##终,不会出现在分词结果中
- endOfCorpus() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Corpus
-
- endsWith(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SuffixDictionary
-
词语是否以该词典中的某个单词结尾
- enQueue(QueueElement) - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.CQueue
-
将QueueElement根据eWeight由小到大的顺序插入队列
- ensureAvailableBytes(int) - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArrayFileStream
-
确保buffer数组余有size个字节
- ensureAvailableBytes(int) - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArrayOtherStream
-
- ensureAvailableBytes(int) - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArrayStream
-
- entropy - 类 中的变量com.hankcs.hanlp.mining.word.WordInfo
-
信息熵
- entry - 类 中的变量com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem
-
条目的key
- entrySet() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
-
- entrySet() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGMap
-
- entrySet() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
-
获取键值对集合
- entrySet() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrie
-
- entrySet() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
- entrySet() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
-
浏览所有词条
- entrySet() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SimpleDictionary
-
获取键值对集合
- entrySet() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SuffixDictionary
-
键值对
- entrySet() - 类 中的方法com.hankcs.hanlp.model.perceptron.feature.FeatureMap
-
- entrySet() - 类 中的方法com.hankcs.hanlp.model.perceptron.feature.ImmutableFeatureDatMap
-
- entrySet() - 类 中的方法com.hankcs.hanlp.model.perceptron.feature.ImmutableFeatureMap
-
- entrySet() - 类 中的方法com.hankcs.hanlp.model.perceptron.feature.ImmutableFeatureMDatMap
-
- entrySet() - 类 中的方法com.hankcs.hanlp.model.perceptron.feature.MutableFeatureMap
-
- ENUM_CREATOR - 类 中的静态变量com.hankcs.hanlp.model.perceptron.cli.Args
-
- EnumItem<E extends Enum<E>> - com.hankcs.hanlp.corpus.dictionary.item中的类
-
对标签-频次的封装
- EnumItem() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.item.EnumItem
-
- EnumItem(E, Integer) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.item.EnumItem
-
创建只有一个标签的条目
- EnumItem(E...) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.item.EnumItem
-
创建一个条目,其标签频次都是1,各标签由参数指定
- EnumItemDictionary<E extends Enum<E>> - com.hankcs.hanlp.dictionary.common中的类
-
枚举条目的通用词典(类似C++的模板,然而Java并没有模板机制,所以有几个方法需要子类啰嗦一下)
- EnumItemDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.common.EnumItemDictionary
-
- eoc - 类 中的变量com.hankcs.hanlp.mining.word2vec.Corpus
-
- EOS - 类 中的静态变量com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- eps - 类 中的静态变量com.hankcs.hanlp.model.crf.crfpp.Mcsrch
-
- equals(Object) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Interval
-
- equals(Object) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
两个状态是否等价,只有状态转移函数完全一致才算相等
Evaluates the equality of this node with another object.
- equals(Object) - 类 中的方法com.hankcs.hanlp.collection.sequence.SString
-
- equals(Object) - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.Sentence
-
- equals(Object) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.action.AbstractInexactAction
-
- equals(Object) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.accessories.Pair
-
- equals(Object) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.structures.Sentence
-
- equals(Object) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.BeamElement
-
- equals(Object) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.Configuration
-
- equals(Object) - 类 中的方法com.hankcs.hanlp.mining.cluster.Document
-
- equals(Object) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Pair
-
Test this Pair for equality with another
Object.
- equals(Object) - 类 中的方法com.hankcs.hanlp.seg.common.Term
-
判断Term是否相等
- equals(Object) - 类 中的方法com.hankcs.hanlp.seg.SegmentPipeline
-
- equals(Object) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.Pipeline
-
- equivalenceClassMDAGNodeHashMap - 类 中的变量com.hankcs.hanlp.collection.MDAG.MDAG
-
等价类集合,相当于论文中的register
- err(String, Object...) - 类 中的方法com.hankcs.hanlp.classification.utilities.io.ConsoleLogger
-
- err(String, Object...) - 接口 中的方法com.hankcs.hanlp.classification.utilities.io.ILogger
-
- err - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.CRFEncoderThread
-
- ERROR_LOG(String, Object...) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.util.Log
-
- estimateEmissionProbability(Collection<int[][]>, int, int) - 类 中的方法com.hankcs.hanlp.model.hmm.HiddenMarkovModel
-
估计状态发射概率
- estimateStartProbability(Collection<int[][]>, int) - 类 中的方法com.hankcs.hanlp.model.hmm.HiddenMarkovModel
-
估计初始状态概率向量
- estimateTransitionProbability(Collection<int[][]>, int) - 类 中的方法com.hankcs.hanlp.model.hmm.HiddenMarkovModel
-
利用极大似然估计转移概率
- estimateTransitionProbability(Collection<int[][]>, int) - 类 中的方法com.hankcs.hanlp.model.hmm.SecondOrderHiddenMarkovModel
-
- eta - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.crf_learn.Option
-
- eval() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- eval(String[]) - 类 中的方法com.hankcs.hanlp.model.maxent.MaxEntModel
-
预测分布
- eval(String[], double[]) - 类 中的方法com.hankcs.hanlp.model.maxent.MaxEntModel
-
预测分布
- eval(int[], double[], EvalParameters) - 类 中的静态方法com.hankcs.hanlp.model.maxent.MaxEntModel
-
预测
- EvalParameters - com.hankcs.hanlp.model.maxent中的类
-
封装了模型用来计算概率的一些参数
- EvalParameters(Context[], double, double, int) - 类 的构造器com.hankcs.hanlp.model.maxent.EvalParameters
-
创建一个参数,可被用于预测
- EvalParameters(Context[], int) - 类 的构造器com.hankcs.hanlp.model.maxent.EvalParameters
-
- evaluate(IClassifier, IDataSet) - 类 中的静态方法com.hankcs.hanlp.classification.statistics.evaluations.Evaluator
-
- evaluate(IClassifier, Map<String, String[]>) - 类 中的静态方法com.hankcs.hanlp.classification.statistics.evaluations.Evaluator
-
- evaluate(POSTagger, String) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.util.PosTagUtil
-
评估词性标注器的准确率
- evaluate(String, String, HashSet<String>) - 类 中的静态方法com.hankcs.hanlp.dependency.perceptron.accessories.Evaluator
-
- evaluate - 类 中的变量com.hankcs.hanlp.dependency.perceptron.accessories.Options
-
- evaluate(String) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.parser.KBeamArcEagerDependencyParser
-
标准化评测
- evaluate(String, String) - 类 中的静态方法com.hankcs.hanlp.mining.cluster.ClusterAnalyzer
-
训练模型
- evaluate(String, LinearModel) - 类 中的方法com.hankcs.hanlp.model.perceptron.CWSTrainer
-
- evaluate(String, String) - 类 中的方法com.hankcs.hanlp.model.perceptron.InstanceConsumer
-
- evaluate(String, LinearModel) - 类 中的方法com.hankcs.hanlp.model.perceptron.InstanceConsumer
-
- evaluate(String) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronClassifier
-
评估
- evaluate(PerceptronClassifier.Instance[]) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronClassifier
-
评估
- evaluate(String) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronSegmenter
-
- evaluate(String) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronTagger
-
性能测试
- evaluate(Instance[], LinearModel) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.utility.IOUtility
-
- evaluate(Instance, LinearModel, int[]) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.utility.IOUtility
-
- evaluate(String, String) - 类 中的静态方法com.hankcs.hanlp.seg.common.CWSEvaluator
-
在标准答案与分词结果上执行评测
- evaluate(Segment, String, String, String) - 类 中的静态方法com.hankcs.hanlp.seg.common.CWSEvaluator
-
标准化评测分词器
- evaluate(Segment, String, String, String, String) - 类 中的静态方法com.hankcs.hanlp.seg.common.CWSEvaluator
-
标准化评测分词器
- evaluate(String, String, String) - 类 中的静态方法com.hankcs.hanlp.seg.common.CWSEvaluator
-
在标准答案与分词结果上执行评测
- evaluateCWS(String, PerceptronSegmenter) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.utility.Utility
-
- evaluateNER(NERecognizer, String) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.utility.Utility
-
- Evaluator - com.hankcs.hanlp.classification.statistics.evaluations中的类
-
分类器性能评测
- Evaluator - com.hankcs.hanlp.corpus.dependency.CoNll中的类
-
测试工具
- Evaluator() - 类 的构造器com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator
-
- Evaluator - com.hankcs.hanlp.dependency.perceptron.accessories中的类
-
- Evaluator() - 类 的构造器com.hankcs.hanlp.dependency.perceptron.accessories.Evaluator
-
- exactMatchSearch(String) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
-
精确匹配
- exactMatchSearch(String) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DoubleArray
-
Returns the corresponding value if the key is found.
- exactMatchSearch(byte[]) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DoubleArray
-
Returns the corresponding value if the key is found.
- exactMatchSearch(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
精确匹配
- exactMatchSearch(String, int, int, int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- exactMatchSearch(char[], int, int, int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
精确查询
- exactMatchSearch(String) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- exactMatchSearch(String, int, int, int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- exceptionToString(Exception) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
-
将异常转为字符串
- execute() - 类 中的方法com.hankcs.hanlp.mining.word2vec.AbstractClosestVectors
-
- exists(String) - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
-
- expected - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.CRFEncoderThread
-
- extend(int) - 类 中的方法com.hankcs.hanlp.dictionary.TransformMatrix
-
拓展内部矩阵,仅用于通过反射新增了枚举实例之后的兼容措施
- extract(String, int) - 类 中的静态方法com.hankcs.hanlp.mining.phrase.MutualInformationEntropyPhraseExtractor
-
一句话提取
- extractAllParseFeatures(Configuration, int) - 类 中的静态方法com.hankcs.hanlp.dependency.perceptron.transition.features.FeatureExtractor
-
Given a list of templates, extracts all features for the given state
- extractBasicFeatureData(IDataSet) - 类 中的静态方法com.hankcs.hanlp.classification.features.ChiSquareFeatureExtractor
-
生成一个FeatureStats对象,包含一个分类中的所有词语,分类数,实例数。
- extractFeature(String, FeatureMap, int) - 类 中的方法com.hankcs.hanlp.model.perceptron.instance.CWSInstance
-
- extractFeature(String[], String[], FeatureMap, int) - 类 中的方法com.hankcs.hanlp.model.perceptron.instance.NERInstance
-
提取特征,override此方法来拓展自己的特征模板
- extractFeature(String[], FeatureMap, int) - 类 中的方法com.hankcs.hanlp.model.perceptron.instance.POSInstance
-
- extractFeature(String, FeatureMap) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronClassifier
-
特征提取
- extractFeature(String, FeatureMap) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronNameGenderClassifier
-
- extractGivenName(String) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.PerceptronNameGenderClassifier
-
去掉姓氏,截取中国人名中的名字
- extractKeyword(String, int) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
提取关键词
- extractKeywords(String) - 类 中的静态方法com.hankcs.hanlp.classification.utilities.TextProcessUtility
-
提取关键词,在真实的应用场景中,还应该涉及到短语
- extractPhrase(String, int) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
提取短语
- extractPhrase(String, int) - 接口 中的方法com.hankcs.hanlp.mining.phrase.IPhraseExtractor
-
提取短语
- extractPhrase(String, int) - 类 中的方法com.hankcs.hanlp.mining.phrase.MutualInformationEntropyPhraseExtractor
-
- extractSuffix(int, int, boolean) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor
-
提取公共后缀
- extractSuffixByWords(int, int, boolean) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor
-
此方法认为后缀一定是整个的词语,所以length是以词语为单位的
- extractSuffixExtended(int, int) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.CommonSuffixExtractor
-
- extractSummary(String, int) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
自动摘要
分割目标文档时的默认句子分割符为,,。
- extractSummary(String, int, String) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
自动摘要
- extractWords(String, int) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
提取词语
- extractWords(BufferedReader, int) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
提取词语
- extractWords(String, int, boolean) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
提取词语(新词发现)
- extractWords(BufferedReader, int, boolean) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
提取词语(新词发现)
- extractWords(BufferedReader, int, boolean, int, float, float, float) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
提取词语(新词发现)
- g - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
学术词汇
- GammaCdf(double, double) - 类 中的静态方法com.hankcs.hanlp.classification.statistics.ContinuousDistributions
-
伽马函数
- GaussCdf(double) - 类 中的静态方法com.hankcs.hanlp.classification.statistics.ContinuousDistributions
-
给定高斯函数的z值,返回p值(累积分布函数值)
http://jamesmccaffrey.wordpress.com/2010/11/05/programmatically-computing-the-area-under-the-normal-curve/
- gb - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
生物相关词汇
- gbc - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
生物类别
- gc - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
化学相关词汇
- Gcf(double, double) - 类 中的静态方法com.hankcs.hanlp.classification.statistics.ContinuousDistributions
-
Internal function used by GammaCdf
- generate(int) - 类 中的方法com.hankcs.hanlp.model.hmm.FirstOrderHiddenMarkovModel
-
- generate(int) - 类 中的方法com.hankcs.hanlp.model.hmm.HiddenMarkovModel
-
生成样本序列
- generate(int, int, int) - 类 中的方法com.hankcs.hanlp.model.hmm.HiddenMarkovModel
-
生成样本序列
- generate(int) - 类 中的方法com.hankcs.hanlp.model.hmm.SecondOrderHiddenMarkovModel
-
- generateBiGraph(WordNet) - 类 中的静态方法com.hankcs.hanlp.seg.WordBasedSegment
-
生成二元词图
- generateKey(String) - 类 中的方法com.hankcs.hanlp.suggest.scorer.BaseScorer
-
生成能够代表这个句子的键
- generateKey(String) - 类 中的方法com.hankcs.hanlp.suggest.scorer.editdistance.EditDistanceScorer
-
- generateKey(String) - 类 中的方法com.hankcs.hanlp.suggest.scorer.lexeme.IdVectorScorer
-
- generateKey(String) - 类 中的方法com.hankcs.hanlp.suggest.scorer.pinyin.PinyinScorer
-
- generateParameter(Table, int) - 类 中的方法com.hankcs.hanlp.model.crf.FeatureTemplate
-
- generateSingleWordContext(CoNLLWord[], int, String) - 类 中的静态方法com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker
-
- generateUniContext(CoNLLWord[], int, int) - 类 中的静态方法com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker
-
- generateWord(List<Vertex>, WordNet) - 类 中的静态方法com.hankcs.hanlp.seg.WordBasedSegment
-
对粗分结果执行一些规则上的合并拆分等等,同时合成新词网
- generateWordNet(WordNet) - 类 中的方法com.hankcs.hanlp.seg.WordBasedSegment
-
生成一元词网
- get(String) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
-
获取值
- get(int) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
-
从值数组中提取下标为index的值
注意为了效率,此处不进行参数校验
- get(Object) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
-
- get(char[]) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
-
- get(String) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
-
- get(Object) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGMap
-
- get(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGMap
-
- get(String) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
-
- get(char[]) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
-
- get(int) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.IntArrayList
-
- get(Object) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrie
-
- get(String, int) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
精确查询
- get(String) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
精确查询
- get(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
精确查询
- get(char[]) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- get(int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
从值数组中提取下标为index的值
注意为了效率,此处不进行参数校验
- get(char[]) - 接口 中的方法com.hankcs.hanlp.collection.trie.ITrie
-
- get(String) - 接口 中的方法com.hankcs.hanlp.collection.trie.ITrie
-
- get(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
-
- get(IWord) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
-
- get(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SimpleDictionary
-
查询一个单词
- get(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SuffixDictionary
-
查找是否有该后缀
- get(int, int) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Get a single element.
- get(String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonDictionary
-
查询一个单词
- get(String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary
-
- get(String) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx
-
- get(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreDictionary
-
获取条目
- get(int) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreDictionary
-
获取条目
- get(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionary
-
- get(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx
-
- get(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
-
查单词
- get(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary
-
- get(char) - 类 中的静态方法com.hankcs.hanlp.dictionary.other.CharType
-
获取字符的类型
- get(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinDictionary
-
- get(Object) - 类 中的方法com.hankcs.hanlp.mining.cluster.SparseVector
-
- get(String) - 类 中的静态方法com.hankcs.hanlp.model.bigram.BigramDependencyModel
-
- get(String, String, String, String) - 类 中的静态方法com.hankcs.hanlp.model.bigram.BigramDependencyModel
-
获取一个词和另一个词最可能的依存关系
- get(String) - 类 中的方法com.hankcs.hanlp.model.bigram.WordNatureDependencyModel
-
- get(String, String) - 类 中的方法com.hankcs.hanlp.model.bigram.WordNatureDependencyModel
-
- get(int, int) - 类 中的方法com.hankcs.hanlp.model.crf.Table
-
获取表中某一个元素
- get(char[]...) - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
-
- get(char...) - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
-
- get(int) - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
-
获取某一行的所有节点
- get(int, int) - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
-
获取某一行长度为length的节点
- get(int) - 类 中的方法com.hankcs.hanlp.seg.SegmentPipeline
-
- get(int) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.Pipeline
-
- get(Object) - 类 中的静态方法com.hankcs.hanlp.utility.GlobalObjectPool
-
获取对象
- getAccuracy() - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronTrainer.Result
-
获取准确率
- getALevel() - 类 中的方法com.hankcs.hanlp.classification.features.ChiSquareFeatureExtractor
-
- getAllPossibleOptions(Options) - 类 中的静态方法com.hankcs.hanlp.dependency.perceptron.accessories.Options
-
- getAllStrings() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
-
取出所有key
Retrieves all the valid Strings that have been inserted in to the MDAG.
- getAlpha() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- getAlpha_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- getAlphaFloat_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- getAnalyzer() - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.LexicalAnalyzerPipeline
-
获取代理的词法分析器
- getAnswer_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- getArray() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Access the internal two-dimensional array.
- getArray() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.structures.CompactArray
-
- getArrayCopy() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Copy the internal two-dimensional array.
- getAttribute() - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
-
获取词的属性
- getAttribute(String) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
-
从HanLP的词库中提取某个单词的属性(包括核心词典和用户词典)
- getAttribute(Term) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
-
从HanLP的词库中提取某个单词的属性(包括核心词典和用户词典)
- getBase() - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
获取base数组引用,不要修改base
- getBase() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- getBaseArraySize() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
- getBestPath() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.NShortPath
-
获取唯一一条最短路径,当然最短路径可能不只一条
- getBiFrequency(String, String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary
-
获取共现频次
- getBiFrequency(int, int) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary
-
获取共现频次
- getBiGram() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
获取二阶共现
- getBigramTempls_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- getBrownCluster4thPrefix() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.structures.Sentence
-
- getBrownCluster6thPrefix() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.structures.Sentence
-
- getBrownClusterFullString() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.structures.Sentence
-
- getBufferItem(int) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
- getBytes() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
-
获取全部字节
- getBytes(InputStream) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
-
- getCallback() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- getCatalog() - 类 中的方法com.hankcs.hanlp.classification.corpus.AbstractDataSet
-
- getCatalog() - 接口 中的方法com.hankcs.hanlp.classification.corpus.IDataSet
-
获取类目表
- getCategories() - 类 中的方法com.hankcs.hanlp.classification.corpus.Catalog
-
- getCategory(int) - 类 中的方法com.hankcs.hanlp.classification.corpus.Catalog
-
- getChar() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
-
- getChar() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
-
- getCharCount(String, String) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
-
得到字符集的字符在字符串中出现的次数
- getCharsetSize() - 接口 中的方法com.hankcs.hanlp.collection.trie.datrie.CharacterMapping
-
- getCharsetSize() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.Utf8CharacterMapping
-
- getCheck() - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
获取check数组引用,不要修改check
- getCheck() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- getCheckArraySize() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
- getChild(char) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
-
获取子节点
- getChild(char) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
-
- getChild(char) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.Node
-
- getChisquareCriticalValue() - 类 中的方法com.hankcs.hanlp.classification.features.ChiSquareFeatureExtractor
-
获取卡方临界值
- getColumnDimension() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Get column dimension.
- getColumnPackedCopy() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Make a one-dimensional column packed copy of the internal array.
- getComplexSentenceList() - 类 中的方法com.hankcs.hanlp.corpus.document.Document
-
获取复杂句子列表,句子中的每个单词有可能是复合词,有可能是简单词
- getConstantInverse() - 类 中的方法com.hankcs.hanlp.model.maxent.EvalParameters
-
- getCorrectionConstant() - 类 中的方法com.hankcs.hanlp.model.maxent.EvalParameters
-
- getCorrectionParam() - 类 中的方法com.hankcs.hanlp.model.maxent.EvalParameters
-
- getCost_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- getCostFactor_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- getDA() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator
-
- getDat() - 类 中的方法com.hankcs.hanlp.seg.Viterbi.ViterbiSegment
-
- getDefaultFeatureTemplate() - 类 中的方法com.hankcs.hanlp.model.crf.CRFNERecognizer
-
- getDefaultFeatureTemplate() - 类 中的方法com.hankcs.hanlp.model.crf.CRFPOSTagger
-
- getDefaultFeatureTemplate() - 类 中的方法com.hankcs.hanlp.model.crf.CRFSegmenter
-
- getDefaultFeatureTemplate() - 类 中的方法com.hankcs.hanlp.model.crf.CRFTagger
-
- getDefaultInitialLearningRate() - 枚举 中的方法com.hankcs.hanlp.mining.word2vec.NeuralNetworkType
-
- getDependent(int) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
- getDeprelTranslator() - 类 中的方法com.hankcs.hanlp.dependency.AbstractDependencyParser
-
- getDeprelTranslator() - 接口 中的方法com.hankcs.hanlp.dependency.IDependencyParser
-
获取依存关系映射表
- getDepth() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
-
获取节点深度
- getDepth() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
-
获取节点深度
- getEdge(Node, Node) - 类 中的方法com.hankcs.hanlp.model.bigram.WordNatureDependencyModel
-
打分
- getEdgeArray() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence
-
获取边的列表,edge[i][j]表示id为i的词语与j存在一条依存关系为该值的边,否则为null
- getEdgeListTo(int) - 类 中的方法com.hankcs.hanlp.seg.common.Graph
-
获取到达顶点to的边列表
- getEdgesTo() - 类 中的方法com.hankcs.hanlp.seg.common.Graph
-
- getElementArray() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Vector
-
- getEmit() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.FragmentToken
-
- getEmit() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.MatchToken
-
- getEmit() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Token
-
- getEmptySize() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
获取空闲的数组元素个数
- getEnd() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Interval
-
- getEnd() - 接口 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Intervalable
-
终点
- getEntrySet() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.TermOccurrence
-
- getExponentialExpandFactor() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.IntArrayList
-
- getFeature_id_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- getFeature_index_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- getFeatureAt(int) - 类 中的方法com.hankcs.hanlp.model.perceptron.instance.Instance
-
- getFeatureCache_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- getFeatureIndex_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.ModelImpl
-
- getFeatureTemplateArray() - 类 中的方法com.hankcs.hanlp.model.crf.LogLinearModel
-
- getFirst() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.Pair
-
- getFirst(int) - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
-
获取某一行的第一个节点
- GetFirst() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.CQueue
-
读取第一个元素,但不执行DeQueue操作
- getFirstChar() - 枚举 中的方法com.hankcs.hanlp.dictionary.py.Pinyin
-
获取首字母
- getFirstCharArray() - 类 中的方法com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey
-
- getFragment() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Token
-
- getFreeSize() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
- getFrequency(E) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.EnumItem
-
- getFrequency(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
-
- getFrequency(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TFDictionary
-
获取频次
- getFrequency() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.TermFrequency
-
- getFrequency(String, String) - 类 中的方法com.hankcs.hanlp.dictionary.TransformMatrixDictionary
-
获取转移频次
- getFrequency(E, E) - 类 中的方法com.hankcs.hanlp.dictionary.TransformMatrixDictionary
-
获取转移频次
- getFrequency() - 类 中的方法com.hankcs.hanlp.seg.common.Term
-
获取本词语在HanLP词库中的频次
- getFrequency(String) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
-
获取某个单词的词频
- getFrom() - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
-
- getGoldDependencies() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.Instance
-
- getHead(int) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
- getHead() - 枚举 中的方法com.hankcs.hanlp.dictionary.py.Pinyin
-
获取输入法头
- getHeadString() - 枚举 中的方法com.hankcs.hanlp.dictionary.py.Pinyin
-
获取输入法头
- getId(String) - 类 中的方法com.hankcs.hanlp.classification.corpus.Catalog
-
- getId(String) - 类 中的方法com.hankcs.hanlp.classification.corpus.Lexicon
-
- getId() - 接口 中的方法com.hankcs.hanlp.corpus.synonym.ISynonym
-
获取ID
- getId() - 类 中的方法com.hankcs.hanlp.corpus.synonym.Synonym
-
- getID(String) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DecoderFeatureIndex
-
- getID(String) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.EncoderFeatureIndex
-
- getID(String) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- getIdString() - 接口 中的方法com.hankcs.hanlp.corpus.synonym.ISynonym
-
获取字符类型的ID
- getIdString() - 类 中的方法com.hankcs.hanlp.corpus.synonym.Synonym
-
- getIncomingTransitionCount() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
Retrieves this node's incoming _transition count
- getIndex() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
-
- getIndex(String[], int, TaggerImpl) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- getInitSize() - 接口 中的方法com.hankcs.hanlp.collection.trie.datrie.CharacterMapping
-
- getInitSize() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.Utf8CharacterMapping
-
- getInputFile() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- getIter() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- getKey() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.Pair
-
- getKey() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger.KeyValuePair
-
- getKey() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- getKey() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Pair
-
Gets the key for this pair.
- getKeyword() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Emit
-
获取对应的模式串
- getKeyword(String) - 类 中的方法com.hankcs.hanlp.summary.TextRankKeyword
-
- getKeywordCounts(String[]) - 类 中的静态方法com.hankcs.hanlp.classification.utilities.TextProcessUtility
-
统计每个词的词频
- getKeywordList(String, int) - 类 中的静态方法com.hankcs.hanlp.mining.word.TermFrequencyCounter
-
提取关键词(线程安全)
- getKeywordList(String, int) - 类 中的静态方法com.hankcs.hanlp.summary.TextRankKeyword
-
提取关键词
- getKeywords(List<Term>, int) - 类 中的方法com.hankcs.hanlp.mining.word.TermFrequencyCounter
-
提取关键词(非线程安全)
- getKeywords(List<Term>, int) - 类 中的方法com.hankcs.hanlp.mining.word.TfIdfCounter
-
- getKeywords(String, int) - 类 中的方法com.hankcs.hanlp.summary.KeywordExtractor
-
提取关键词
- getKeywords(String) - 类 中的方法com.hankcs.hanlp.summary.KeywordExtractor
-
提取关键词(top 10)
- getKeywords(List<Term>, int) - 类 中的方法com.hankcs.hanlp.summary.KeywordExtractor
-
- getKeywords(List<Term>, int) - 类 中的方法com.hankcs.hanlp.summary.TextRankKeyword
-
- getKeywordsOf(Object) - 类 中的方法com.hankcs.hanlp.mining.word.TfIdfCounter
-
- getKeywordsOf(Object, int) - 类 中的方法com.hankcs.hanlp.mining.word.TfIdfCounter
-
- getKeywordsWithTfIdf(String, int) - 类 中的方法com.hankcs.hanlp.mining.word.TfIdfCounter
-
- getKeywordsWithTfIdf(List<Term>, int) - 类 中的方法com.hankcs.hanlp.mining.word.TfIdfCounter
-
- getLA() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator
-
- getLabel() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
-
- getLabel() - 接口 中的方法com.hankcs.hanlp.corpus.document.sentence.word.IWord
-
获取标签
- getLabel() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.Word
-
- getLabels() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.structures.IndexMaps
-
依存关系
- getLargestValueId() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
-
获取最大的值
- getLast() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.IntArrayList
-
- getLayer1Size() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- getLength() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
-
- getLength() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- getLetter() - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
-
Retrieves the character representing the _transition laben leading up to this node.
- getLexemeArray(List<CommonSynonymDictionary.SynonymItem>) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionary
-
获取语义标签
- getLexemeArray(List<CommonSynonymDictionary.SynonymItem>) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionaryEx
-
获取语义标签
- getLexicon() - 类 中的方法com.hankcs.hanlp.classification.corpus.AbstractDataSet
-
- getLexicon() - 接口 中的方法com.hankcs.hanlp.classification.corpus.IDataSet
-
获取词表
- getLinearExpandFactor() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.IntArrayList
-
- getLongestSearcher(String, int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- getLongestSearcher(char[], int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- getLongestSuffixLength(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SuffixDictionary
-
获取最长的后缀
- getMatrix(int, int, int, int) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Get a submatrix.
- getMatrix(int[], int[]) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Get a submatrix.
- getMatrix(int, int, int[]) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Get a submatrix.
- getMatrix(int[], int, int) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Get a submatrix.
- getMatrixElement(int, int) - 类 中的方法com.hankcs.hanlp.mining.word2vec.VectorsReader
-
- getMax_xsize_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- getMaxid_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- getMaximumValue() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
可以设置的最大值
- getMaxSynonymItemIdDistance() - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary
-
获取最大id
- getMinCount() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- getMode_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- getModel() - 接口 中的方法com.hankcs.hanlp.classification.classifiers.IClassifier
-
获取训练后的模型,可用于序列化保存或预测.
- getModel() - 类 中的方法com.hankcs.hanlp.classification.classifiers.NaiveBayesClassifier
-
- getModel() - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronClassifier
-
- getModel() - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronTagger
-
- getModel() - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronTrainer.Result
-
获取模型
- getMostLikelyLabel() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
-
- getNaiveBayesModel() - 类 中的方法com.hankcs.hanlp.classification.classifiers.NaiveBayesClassifier
-
获取训练结果
- getNature() - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
-
获取该节点的词性,如果词性还未确定,则返回null
- getNature() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.AtomNode
-
原子的词性
- getNatureFrequency(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
-
- getNatureFrequency(Nature) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
-
获取词性的词频
- getNatureFrequency(String) - 类 中的方法com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
-
- getNatureFrequency(Nature) - 类 中的方法com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
-
获取词性的词频
- getNbest_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.ModelImpl
-
- getNbest_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- getNegative() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- getNERTagSet() - 类 中的方法com.hankcs.hanlp.model.crf.CRFNERecognizer
-
- getNERTagSet() - 类 中的方法com.hankcs.hanlp.model.hmm.HMMNERecognizer
-
- getNERTagSet() - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronNERecognizer
-
- getNERTagSet() - 类 中的方法com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
- getNERTagSet() - 接口 中的方法com.hankcs.hanlp.tokenizer.lexical.NERecognizer
-
- getNERTagSet() - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.LexicalAnalyzerPipeline
-
- GetNext() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.CQueue
-
读取上次读取后的下一个元素,不执行DeQueue操作
- getNode_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- getNodeList_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- getNonzeroSize() - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- getNonzeroSize() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- getNPaths(int) - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.NShortPath
-
从短到长获取至多 n 条路径
- getNPaths() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.NShortPath
-
获取前10条最短路径
- getNumOutcomes() - 类 中的方法com.hankcs.hanlp.model.maxent.EvalParameters
-
- getNumThreads() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- getNumWords() - 类 中的方法com.hankcs.hanlp.mining.word2vec.VectorsReader
-
- getOffset() - 类 中的方法com.hankcs.hanlp.corpus.io.ByteArray
-
- getOffset() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.structures.CompactArray
-
- getOffset() - 类 中的方法com.hankcs.hanlp.dictionary.BaseSearcher
-
获取当前偏移
- getOutcomes() - 类 中的方法com.hankcs.hanlp.model.maxent.Context
-
获取输出
- getOutgoingTransitionCount() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
Retrieves this node's outgoing _transition count.
- getOutgoingTransitions() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
Retrieves this node's outgoing transitions.
- getOutgoingTransitionSetSize() - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
-
Retrieves the size of this node's outgoing _transition set.
- getOutputFile() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- getPairFrequency(String, String) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
- getParameters() - 类 中的方法com.hankcs.hanlp.model.maxent.Context
-
获取参数
- getParams() - 类 中的方法com.hankcs.hanlp.model.maxent.EvalParameters
-
- getPathList_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- getPaths(int) - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.NShortPath
-
获取前index+1短的路径
- getPerceptionNERecognizer() - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronLexicalAnalyzer
-
获取命名实体识别器
- getPerceptronPOSTagger() - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronLexicalAnalyzer
-
获取词性标注器
- getPerceptronSegmenter() - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronLexicalAnalyzer
-
获取分词器
- getPhraseByLe() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
- getPhraseByMi() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
- getPhraseByRe() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
- getPhraseByScore() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
- getPinyin(int) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.Integer2PinyinConverter
-
- getPinyinWithoutTone() - 枚举 中的方法com.hankcs.hanlp.dictionary.py.Pinyin
-
获取纯字母的拼音
- getPinyinWithToneMark() - 枚举 中的方法com.hankcs.hanlp.dictionary.py.Pinyin
-
获取带音调的拼音
- getRealWord() - 接口 中的方法com.hankcs.hanlp.corpus.synonym.ISynonym
-
获取原本的词语
- getRealWord() - 类 中的方法com.hankcs.hanlp.corpus.synonym.Synonym
-
- getRealWord() - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
-
获取真实词
- getResourceAsStream(String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
-
class.getResourceAsStream的wrapper,在资源不存在的情况下抛出IOException,
- getResult(boolean) - 类 中的方法com.hankcs.hanlp.seg.common.CWSEvaluator
-
获取PRF
- getResult() - 类 中的方法com.hankcs.hanlp.seg.common.CWSEvaluator
-
获取PRF
- getResult_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- getReversedDependencies() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.Instance
-
- getRowDimension() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Get row dimension.
- getRowPackedCopy() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Make a one-dimensional row packed copy of the internal array.
- getSample() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- getScore(boolean) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.Configuration
-
Returns the current score of the configuration
- getSearcher(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- getSearcher(String, int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- getSearcher(char[], int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- getSearcher(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.EasyDictionary
-
- getSearcher(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
-
- getSearcher(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
-
获取一个BinTrie的查询工具
- getSearcher(char[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary
-
- getSearcher(char[], DoubleArrayTrie<Pinyin[]>) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinDictionary
-
- getSearcher(char[], DoubleArrayTrie<String>) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary
-
- getSecond() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.Pair
-
- getSegment() - 类 中的方法com.hankcs.hanlp.dependency.AbstractDependencyParser
-
- getSegment() - 接口 中的方法com.hankcs.hanlp.dependency.IDependencyParser
-
获取Parser使用的分词器
- getSegment() - 类 中的方法com.hankcs.hanlp.summary.KeywordExtractor
-
- getSentence() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.Instance
-
- getShengmu() - 枚举 中的方法com.hankcs.hanlp.dictionary.py.Pinyin
-
获取声母
- getSimpleMDAGArray() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
-
获取简化后的状态Array
Returns the array of SimpleMDAGNodes collectively containing the
data of this MDAG, or null if it hasn't been simplified yet.
- getSimpleSentenceList() - 类 中的方法com.hankcs.hanlp.corpus.document.Document
-
获取简单的句子列表,其中复合词会被拆分为简单词
- getSimpleSentenceList(boolean) - 类 中的方法com.hankcs.hanlp.corpus.document.Document
-
获取简单的句子列表
- getSimpleSentenceList(Set<String>) - 类 中的方法com.hankcs.hanlp.corpus.document.Document
-
获取简单的句子列表,其中复合词的标签如果是set中指定的话会被拆分为简单词
- getSimpleWordList() - 类 中的方法com.hankcs.hanlp.corpus.document.Document
-
- getSize() - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- getSize() - 类 中的方法com.hankcs.hanlp.mining.word2vec.VectorsReader
-
- getSize() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- getStack() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
- getStart() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Interval
-
- getStart() - 接口 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Intervalable
-
起点
- getStates() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
-
- getStates() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
-
- getStatus() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
-
获取节点的成词状态
- getStringsEndingWith(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
-
后缀查询
Retrieves all the Strings in the MDAG that begin with a given String.
- getStringsStartingWith(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
-
前缀查询
Retrieves all the Strings in the MDAG that begin with a given String.
- getStringsWithSubstring(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
-
返回包含字串的key
Retrieves all the Strings in the MDAG that contain a given String.
- getSuccess() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
-
获取goto表
- getSuffix(String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
-
获取最后一个分隔符的后缀
- getsum() - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
-
- getSummary(String, int) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
自动摘要
分割目标文档时的默认句子分割符为,,。
- getSummary(String, int, String) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
自动摘要
- getSummary(String, int) - 类 中的静态方法com.hankcs.hanlp.summary.TextRankSentence
-
一句话调用接口
- getSummary(String, int, String) - 类 中的静态方法com.hankcs.hanlp.summary.TextRankSentence
-
一句话调用接口
- getTagId(String) - 类 中的方法com.hankcs.hanlp.model.crf.CRFModel
-
获取某个tag的ID
- getTags() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.structures.Sentence
-
- getTagSet() - 类 中的方法com.hankcs.hanlp.model.hmm.HMMNERecognizer
-
- getTagSet() - 类 中的方法com.hankcs.hanlp.model.hmm.HMMPOSTagger
-
- getTagSet() - 类 中的方法com.hankcs.hanlp.model.hmm.HMMSegmenter
-
- getTagSet() - 类 中的方法com.hankcs.hanlp.model.hmm.HMMTrainer
-
- getTargetVector() - 类 中的方法com.hankcs.hanlp.mining.word2vec.AbstractClosestVectors
-
- getTargetVector() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Distance
-
- getTargetVector() - 类 中的方法com.hankcs.hanlp.mining.word2vec.WordAnalogy
-
- getTemplate() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- getTemplate() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.ModelImpl
-
- getTemplate() - 类 中的方法com.hankcs.hanlp.model.crf.CRFTagger
-
获取特征模板
- getTemplate() - 类 中的方法com.hankcs.hanlp.model.crf.FeatureTemplate
-
- getTerm() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.TermFrequency
-
- getTermAndRank(String) - 类 中的方法com.hankcs.hanlp.summary.TextRankKeyword
-
返回全部分词结果和对应的rank
- getTermAndRank(String, int) - 类 中的方法com.hankcs.hanlp.summary.TextRankKeyword
-
返回分数最高的前size个分词结果和对应的rank
- getTermAndRank(List<Term>) - 类 中的方法com.hankcs.hanlp.summary.TextRankKeyword
-
使用已经分好的词来计算rank
- getTermFrequency(String) - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
获取词频
- getTermFrequency(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreDictionary
-
获取词频
- getTfMap() - 类 中的方法com.hankcs.hanlp.classification.corpus.BagOfWordsDocument
-
- getTfMap() - 接口 中的方法com.hankcs.hanlp.classification.corpus.ITermFrequencyHolder
-
- getTfMap() - 类 中的方法com.hankcs.hanlp.mining.word.TfIdfCounter
-
- getThread_id_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- getThreadNum_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- getTokenizer() - 类 中的方法com.hankcs.hanlp.classification.corpus.AbstractDataSet
-
- getTokenizer() - 接口 中的方法com.hankcs.hanlp.classification.corpus.IDataSet
-
获取分词器
- getTone() - 枚举 中的方法com.hankcs.hanlp.dictionary.py.Pinyin
-
获取声调
- getTopSentence(int) - 类 中的方法com.hankcs.hanlp.summary.TextRankSentence
-
获取前几个关键句子
- getTopSentenceList(String, int) - 类 中的静态方法com.hankcs.hanlp.summary.TextRankSentence
-
一句话调用接口
- getTopSentenceList(String, int, String) - 类 中的静态方法com.hankcs.hanlp.summary.TextRankSentence
-
一句话调用接口
- getTotalFrequency() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
-
获取全部频次
- getTotalFrequency(int) - 类 中的方法com.hankcs.hanlp.dictionary.TransformMatrix
-
- getTotalFrequency(E) - 类 中的方法com.hankcs.hanlp.dictionary.TransformMatrixDictionary
-
获取e的总频次
- getTotalFrequency() - 类 中的方法com.hankcs.hanlp.dictionary.TransformMatrixDictionary
-
获取所有标签的总频次
- getTotalSize() - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- getTotalSize() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- getTraditionalChinese(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.SimplifiedChineseDictionary
-
- getTrainWords() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Corpus
-
- getTransitionPathNodes(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
获取一个字符串路径上经过的节点
Retrieves the nodes in the _transition path starting
from this node corresponding to a given String .
- getTransitions() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
-
- getTransitions() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
-
- getTransitionSetBeginIndex() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
Retrieves the index in a simplified mdag data array that the SimpleMDAGNode
representation of this node's outgoing _transition set begins at.
- getTransitionSetBeginIndex() - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
-
Retrieves the index in this node's containing array that its _transition set begins at.
- getTrie() - 类 中的静态方法com.hankcs.hanlp.dictionary.CustomDictionary
-
- getTrie() - 类 中的方法com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment
-
- getTriGram() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
获取三阶共现
- getUA() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator
-
- getUniGram() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
获取一阶共现,其实就是词频统计
- getUnigramTempls_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- getUnitSize() - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- getUnitSize() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- getUnsigned(byte) - 类 中的静态方法com.hankcs.hanlp.utility.TextUtility
-
获取字节对应的无符号整型数
- getValue() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.Pair
-
- getValue() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
-
获取节点对应的值
- getValue() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger.KeyValuePair
-
- getValue() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
-
- getValue() - 接口 中的方法com.hankcs.hanlp.corpus.document.sentence.word.IWord
-
获取单词
- getValue() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.Word
-
- getValue() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- getValue() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Pair
-
Gets the value for this pair.
- getValueArray(V[]) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
-
- getValueArray(V[]) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
-
- getValueArray(V[]) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- getValueArray(V[]) - 接口 中的方法com.hankcs.hanlp.collection.trie.ITrie
-
- getValueAt(int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
获取index对应的值
- getVertexes() - 类 中的方法com.hankcs.hanlp.seg.common.Graph
-
- getVertexes() - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
-
获取内部顶点表格,谨慎操作!
- getVlevel_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.ModelImpl
-
- getVlevel_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- getVocab() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Corpus
-
- getVocabIndexMap() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Corpus
-
- getVocabSize() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Corpus
-
- getWindow() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- getWord(int) - 类 中的方法com.hankcs.hanlp.classification.corpus.Lexicon
-
- getWord(int) - 类 中的方法com.hankcs.hanlp.mining.word2vec.VectorsReader
-
- getWordArray() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence
-
- getWordArrayWithRoot() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence
-
获取包含根节点在内的单词数组
- getWordId() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.structures.IndexMaps
-
- getWordID(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreBiGramTableDictionary
-
获取词语的ID
- getWordID(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreDictionary
-
获取词语的ID
- getWordIdArray() - 类 中的方法com.hankcs.hanlp.classification.corpus.Lexicon
-
- GetWordInfo(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.EasyDictionary
-
- getWordList() - 类 中的方法com.hankcs.hanlp.corpus.document.Document
-
获取单词序列
- getWords() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.structures.Sentence
-
- getX_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- getXsize_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- getY_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- getYsize_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- getYunmu() - 枚举 中的方法com.hankcs.hanlp.dictionary.py.Pinyin
-
获取韵母
- getZ_() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- gg - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
地理地质相关词汇
- gi - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
计算机相关词汇
- GlobalObjectPool - com.hankcs.hanlp.utility中的类
-
全局对象缓存池
用于储存那些体积庞当的模型,如果该模型已经被加载过一次,那么就不需要重新加载。
- GlobalObjectPool() - 类 的构造器com.hankcs.hanlp.utility.GlobalObjectPool
-
- gm - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
数学相关词汇
- goldDependencies - 类 中的变量com.hankcs.hanlp.dependency.perceptron.transition.configuration.CompactTree
-
- goldDependencies - 类 中的变量com.hankcs.hanlp.dependency.perceptron.transition.configuration.Instance
-
dependent -> head
- goldFile - 类 中的变量com.hankcs.hanlp.dependency.perceptron.accessories.Options
-
- gp - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
物理相关词汇
- gradient(double[]) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
计算梯度
- Graph - com.hankcs.hanlp.seg.common中的类
-
- Graph(Vertex[]) - 类 的构造器com.hankcs.hanlp.seg.common.Graph
-
将一个词网转为词图
- Gser(double, double) - 类 中的静态方法com.hankcs.hanlp.classification.statistics.ContinuousDistributions
-
Internal function used by GammaCdf
- guessAttribute(Term) - 类 中的静态方法com.hankcs.hanlp.seg.CharacterBasedSegment
-
查询或猜测一个词语的属性,
先查词典,然后对字母、数字串的属性进行判断,最后猜测未登录词
- guessNature() - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
-
猜测最可能的词性,也就是这个节点的词性中出现频率最大的那一个词性
- m - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
数词
- M - 类 中的静态变量com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary
-
名
- M - 类 中的变量com.hankcs.hanlp.model.perceptron.tagset.CWSTagSet
-
- M_TAG_PREFIX - 类 中的变量com.hankcs.hanlp.model.perceptron.tagset.NERTagSet
-
- M_WORD_ID - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreDictionary
-
- Main - com.hankcs.hanlp.dependency.perceptron.parser中的类
-
- Main() - 类 的构造器com.hankcs.hanlp.dependency.perceptron.parser.Main
-
- main(String[]) - 类 中的静态方法com.hankcs.hanlp.dependency.perceptron.parser.Main
-
- main(String[]) - 类 中的静态方法com.hankcs.hanlp.mining.word2vec.ComputeAccuracy
-
- main(String[]) - 类 中的静态方法com.hankcs.hanlp.mining.word2vec.Distance
-
- main(String[]) - 类 中的静态方法com.hankcs.hanlp.mining.word2vec.Train
-
- main(String[]) - 类 中的静态方法com.hankcs.hanlp.mining.word2vec.WordAnalogy
-
- main(String[]) - 类 中的静态方法com.hankcs.hanlp.mining.word2vec.WordCluster
-
- main(String[]) - 类 中的静态方法com.hankcs.hanlp.model.crf.crfpp.crf_learn
-
- main(String[]) - 类 中的静态方法com.hankcs.hanlp.model.crf.crfpp.crf_test
-
- main(String[]) - 类 中的静态方法com.hankcs.hanlp.model.crf.crfpp.DecoderFeatureIndex
-
- main(String[]) - 类 中的静态方法com.hankcs.hanlp.model.crf.crfpp.Encoder
-
- main(String[]) - 类 中的静态方法com.hankcs.hanlp.model.crf.crfpp.EncoderFeatureIndex
-
- main(String[]) - 类 中的静态方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- Main - com.hankcs.hanlp.model.perceptron中的类
-
- Main() - 类 的构造器com.hankcs.hanlp.model.perceptron.Main
-
- main(String[]) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.Main
-
- make_left_arc(int) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.action.ActionFactory
-
建立右焦点词依存于左焦点词的依存关系
- make_right_arc(int) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.action.ActionFactory
-
建立左焦点词依存于右焦点词的依存关系
- make_shift() - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.action.ActionFactory
-
不建立依存关系,只转移句法分析的焦点,即新的左焦点词是原来的右焦点词,依此类推。
- makeEdge(Node[], int, int) - 类 中的方法com.hankcs.hanlp.dependency.MaxEntDependencyParser
-
已过时。
- makeEdge(Node[], int, int) - 类 中的方法com.hankcs.hanlp.dependency.MinimumSpanningTreeParser
-
- makeEdge(Node[], int, int) - 类 中的方法com.hankcs.hanlp.dependency.WordNatureDependencyParser
-
- makeModel(String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker
-
- makeModel(String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.dependency.model.WordNatureWeightModelMaker
-
- makeSentence(String[], String[], boolean, boolean) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.structures.IndexMaps
-
将句子中的字符串转换为id
- makeTempls(List<String>, List<String>) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- makeToneToTheSame(List<Pinyin>) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.String2PinyinConverter
-
将所有音调都转为1
- maps - 类 中的变量com.hankcs.hanlp.dependency.perceptron.structures.ParserModel
-
- maps - 类 中的变量com.hankcs.hanlp.dependency.perceptron.transition.parser.TransitionBasedParser
-
- MatchToken - com.hankcs.hanlp.algorithm.ahocorasick.trie中的类
-
匹配到的片段
- MatchToken(String, Emit) - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.MatchToken
-
- math - com.hankcs.hanlp.dependency.nnparser.util中的类
-
- math() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.util.math
-
- MathUtility - com.hankcs.hanlp.utility中的类
-
一些数学小工具
- MathUtility() - 类 的构造器com.hankcs.hanlp.utility.MathUtility
-
- Matrix - com.hankcs.hanlp.dependency.nnparser中的类
-
Jama = Java Matrix class.
- Matrix(int, int) - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Matrix
-
Construct an m-by-n matrix of zeros.
- Matrix(int, int, double) - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Matrix
-
Construct an m-by-n constant matrix.
- Matrix(double[][]) - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Matrix
-
Construct a matrix from a 2-D array.
- Matrix(double[][], int, int) - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Matrix
-
Construct a matrix quickly without checking arguments.
- Matrix(double[], int) - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Matrix
-
Construct a matrix from a one-dimensional packed array
- Matrix() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Matrix
-
- matrix - 类 中的变量com.hankcs.hanlp.model.crf.CRFModel
-
tag的二元转移矩阵,适用于BiGram Feature
- max(Map<String, Double>) - 类 中的静态方法com.hankcs.hanlp.classification.utilities.CollectionUtility
-
- MAX_CODE_LENGTH - 类 中的静态变量com.hankcs.hanlp.mining.word2vec.VocabWord
-
- MAX_FREQUENCY - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
- MAX_INDEX_LENGTH - 类 中的静态变量com.hankcs.hanlp.corpus.synonym.SynonymHelper
-
尾数的长度,表示原子词的index
- max_iter - 类 中的静态变量com.hankcs.hanlp.summary.TextRankKeyword
-
最大迭代次数
- MAX_SEGMENT_NUM - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
- MAX_WORDS - 类 中的静态变量com.hankcs.hanlp.corpus.synonym.SynonymHelper
-
同一行最多支持编码这么多个单词
- max_xsize_ - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- MaxEntDependencyModelMaker - com.hankcs.hanlp.corpus.dependency.model中的类
-
最大熵模型构建工具,训练暂时不使用自己的代码,借用opennlp训练。
- MaxEntDependencyModelMaker() - 类 的构造器com.hankcs.hanlp.corpus.dependency.model.MaxEntDependencyModelMaker
-
- MaxEntDependencyParser - com.hankcs.hanlp.dependency中的类
-
- MaxEntDependencyParser(MaxEntModel) - 类 的构造器com.hankcs.hanlp.dependency.MaxEntDependencyParser
-
已过时。
- MaxEntDependencyParser() - 类 的构造器com.hankcs.hanlp.dependency.MaxEntDependencyParser
-
已过时。
- MaxEntModel - com.hankcs.hanlp.model.maxent中的类
-
最大熵模型,采用双数组Trie树加速,值得拥有
- MaxEntModel() - 类 的构造器com.hankcs.hanlp.model.maxent.MaxEntModel
-
- MaxEntModelPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
-
- MaxHeap<E> - com.hankcs.hanlp.algorithm中的类
-
用固定容量的优先队列模拟的最大堆,用于解决求topN大的问题
- MaxHeap(int, Comparator<E>) - 类 的构造器com.hankcs.hanlp.algorithm.MaxHeap
-
构造最大堆
- maxid_ - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- maxiter - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.crf_learn.Option
-
- maxSentenceSize - 类 中的变量com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
- maxSize - 类 中的变量com.hankcs.hanlp.classification.features.ChiSquareFeatureExtractor
-
- Mcsrch - com.hankcs.hanlp.model.crf.crfpp中的类
-
- Mcsrch() - 类 的构造器com.hankcs.hanlp.model.crf.crfpp.Mcsrch
-
- mcstep(double[], double[], double[], double[], double[], double[], double[], double, double, boolean[], double, double, int[]) - 类 中的静态方法com.hankcs.hanlp.model.crf.crfpp.Mcsrch
-
- MDAG - com.hankcs.hanlp.collection.MDAG中的类
-
最小环形图
A minimalistic directed acyclical graph suitable for storing a set of Strings.
- MDAG(String) - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAG
-
从文件路径构造
- MDAG(File) - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAG
-
从一个文件建立MDAG
Creates an MDAG from a newline delimited file containing the data of interest.
- MDAG(BufferedReader) - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAG
-
从一个打开的BufferedReader构造
- MDAG(Collection<String>) - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAG
-
Creates an MDAG from a collection of Strings.
- MDAG() - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAG
-
空白图
- mdagDataArray - 类 中的变量com.hankcs.hanlp.collection.MDAG.MDAG
-
调用simplify()后填充此空间
- MDAGMap<V> - com.hankcs.hanlp.collection.MDAG中的类
-
最好不要把MDAG当map用,现在的实现在key后面放一个int,导致右语言全部不同,退化为bintrie
- MDAGMap() - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAGMap
-
- MDAGNode - com.hankcs.hanlp.collection.MDAG中的类
-
MDAG中的一个节点
The class which represents a node in a MDAG.
- MDAGNode(boolean) - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAGNode
-
建立一个节点
Constructs an MDAGNode.
- MDAGSet - com.hankcs.hanlp.collection.MDAG中的类
-
基于MDAG(又称DAWG,Minimal Acyclic Finite-State Automata)的String Set
- MDAGSet(File) - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAGSet
-
- MDAGSet(Collection<String>) - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAGSet
-
- MDAGSet() - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAGSet
-
- MDAGSet(String) - 类 的构造器com.hankcs.hanlp.collection.MDAG.MDAGSet
-
- meet(String, State) - 接口 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Trie.IWalker
-
遇到了一个节点
- MemoryDataSet - com.hankcs.hanlp.classification.corpus中的类
-
- MemoryDataSet() - 类 的构造器com.hankcs.hanlp.classification.corpus.MemoryDataSet
-
- MemoryDataSet(AbstractModel) - 类 的构造器com.hankcs.hanlp.classification.corpus.MemoryDataSet
-
- mergeCompoundWords() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.Sentence
-
- mergeContinuousNsIntoOne() - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
-
将连续的ns节点合并为一个
- mergeNumberQuantifier(List<Vertex>, WordNet, Config) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
合并数字
- mg - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
数语素
- Mg - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
甲乙丙丁之类的数词
- mi - 类 中的变量com.hankcs.hanlp.corpus.occurrence.PairFrequency
-
互信息值
- MIN_PROBABILITY - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
- minCount - 类 中的变量com.hankcs.hanlp.mining.word2vec.Config
-
- MinimumSpanningTreeParser - com.hankcs.hanlp.dependency中的类
-
- MinimumSpanningTreeParser() - 类 的构造器com.hankcs.hanlp.dependency.MinimumSpanningTreeParser
-
- minus(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
C = A - B
- minus(Vector) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Vector
-
- MINUS_LOG_EPSILON - 类 中的静态变量com.hankcs.hanlp.model.crf.crfpp.Node
-
- minusEquals(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
A = A - B
- Model - com.hankcs.hanlp.model.crf.crfpp中的类
-
- Model() - 类 的构造器com.hankcs.hanlp.model.crf.crfpp.Model
-
- model - 类 中的变量com.hankcs.hanlp.model.crf.CRFTagger
-
- model - 类 中的变量com.hankcs.hanlp.model.perceptron.PerceptronTagger
-
用StructurePerceptron实现在线学习
- MODEL_VERSION - 类 中的静态变量com.hankcs.hanlp.model.crf.crfpp.Encoder
-
- modelFile - 类 中的变量com.hankcs.hanlp.dependency.perceptron.accessories.Options
-
- ModelImpl - com.hankcs.hanlp.model.crf.crfpp中的类
-
- ModelImpl() - 类 的构造器com.hankcs.hanlp.model.crf.crfpp.ModelImpl
-
- mq - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
数量词
- mutable - 类 中的变量com.hankcs.hanlp.model.perceptron.feature.FeatureMap
-
是否允许新增特征
- MutableDoubleArrayTrie<V> - com.hankcs.hanlp.collection.trie.datrie中的类
-
泛型可变双数组trie树
- MutableDoubleArrayTrie() - 类 的构造器com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrie
-
- MutableDoubleArrayTrie(Map<String, V>) - 类 的构造器com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrie
-
- MutableDoubleArrayTrieInteger - com.hankcs.hanlp.collection.trie.datrie中的类
-
可变双数组trie树,重构自:https://github.com/fancyerii/DoubleArrayTrie
- MutableDoubleArrayTrieInteger(Map<String, Integer>) - 类 的构造器com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
- MutableDoubleArrayTrieInteger(Set<Map.Entry<String, Integer>>) - 类 的构造器com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
- MutableDoubleArrayTrieInteger() - 类 的构造器com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
- MutableDoubleArrayTrieInteger(CharacterMapping) - 类 的构造器com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
- MutableDoubleArrayTrieInteger.KeyValuePair - com.hankcs.hanlp.collection.trie.datrie中的类
-
- MutableFeatureMap - com.hankcs.hanlp.model.perceptron.feature中的类
-
- MutableFeatureMap(TagSet) - 类 的构造器com.hankcs.hanlp.model.perceptron.feature.MutableFeatureMap
-
- MutableFeatureMap(TagSet, Map<String, Integer>) - 类 的构造器com.hankcs.hanlp.model.perceptron.feature.MutableFeatureMap
-
- MutualInformationEntropyPhraseExtractor - com.hankcs.hanlp.mining.phrase中的类
-
利用互信息和左右熵的短语提取器
- MutualInformationEntropyPhraseExtractor() - 类 的构造器com.hankcs.hanlp.mining.phrase.MutualInformationEntropyPhraseExtractor
-
- s - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
处所词
- S - 类 中的变量com.hankcs.hanlp.model.perceptron.tagset.CWSTagSet
-
- s2hk(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
簡體到香港繁體
- s2t(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
- s2tw(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
簡體到臺灣正體
- S_TAG - 类 中的变量com.hankcs.hanlp.model.perceptron.tagset.NERTagSet
-
- S_TAG_CHAR - 类 中的变量com.hankcs.hanlp.model.perceptron.tagset.NERTagSet
-
- Sample - com.hankcs.hanlp.dependency.nnparser中的类
-
- Sample() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Sample
-
- Sample(List<Integer>, List<Double>) - 类 的构造器com.hankcs.hanlp.dependency.nnparser.Sample
-
- sample - 类 中的变量com.hankcs.hanlp.mining.word2vec.Config
-
- samples() - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
-
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
-
持久化
- save(ObjectOutputStream) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
-
持久化
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
-
- save(OutputStream) - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DoubleArray
-
Saves the trie data into a stream.
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
-
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
-
- save(String) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
-
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
-
保存到二进制输出流
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.IntArrayList
-
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
- save(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
将base和check保存下来
- save(ObjectOutputStream) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- save(DataOutputStream) - 接口 中的方法com.hankcs.hanlp.collection.trie.ITrie
-
- save(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.StringDictionary
-
保存词典
- save(DataOutputStream) - 接口 中的方法com.hankcs.hanlp.corpus.io.ICacheAble
-
写入
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Alphabet
-
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.NeuralNetworkParser
-
保存到磁盘
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
-
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.model.crf.CRFModel
-
- save(String) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- save(String, boolean) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.EncoderFeatureIndex
-
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.model.crf.FeatureFunction
-
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.model.crf.FeatureTemplate
-
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.model.perceptron.feature.FeatureMap
-
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.model.perceptron.feature.ImmutableFeatureMDatMap
-
- save(String) - 类 中的方法com.hankcs.hanlp.model.perceptron.model.LinearModel
-
保存到路径
- save(String, double) - 类 中的方法com.hankcs.hanlp.model.perceptron.model.LinearModel
-
压缩并保存
- save(String, Set<Map.Entry<String, Integer>>, double) - 类 中的方法com.hankcs.hanlp.model.perceptron.model.LinearModel
-
- save(String, Set<Map.Entry<String, Integer>>, double, boolean) - 类 中的方法com.hankcs.hanlp.model.perceptron.model.LinearModel
-
保存
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.model.perceptron.model.LinearModel
-
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.model.perceptron.tagset.TagSet
-
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel
-
- save(DataOutputStream) - 类 中的方法com.hankcs.hanlp.model.trigram.frequency.Probability
-
- saveCollectionToTxt(Collection<T>, String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
-
- saveCorpus(List<Document>, String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.CorpusLoader
-
- saveDat(String, List<V>) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonDictionary
-
保存dat到路径
- saveEntrySetToTxt(Set<Map.Entry<Object, Object>>, String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
-
- saveKeyTo(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TFDictionary
-
仅仅将值保存到文件
- saveMapToTxt(Map<Object, Object>, String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
-
- saveMapToTxt(Map<Object, Object>, String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
-
- saveModel(String) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.structures.ParserModel
-
- saveNGramToTxt(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker
-
保存NGram词典
- saveObjectTo(Object, String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
-
序列化对象
- saveSentenceList(List<List<IWord>>, String) - 类 中的静态方法com.hankcs.hanlp.corpus.document.CorpusLoader
-
- saveTransformMatrixToTxt(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker
-
保存转移矩阵
- saveTxt(String, String) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
-
快速保存
- saveTxt(String, StringBuilder) - 类 中的静态方法com.hankcs.hanlp.corpus.io.IOUtil
-
- saveTxtTo(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker
-
- saveTxtTo(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
-
- saveTxtTo(String, DictionaryMaker.Filter) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
-
允许保存之前对其做一些调整
- saveTxtTo(String) - 接口 中的方法com.hankcs.hanlp.corpus.dictionary.ISaveAble
-
将自己以文本文档的方式保存到磁盘
- saveTxtTo(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NGramDictionaryMaker
-
保存NGram词典和转移矩阵
- saveTxtTo(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.NTDictionaryMaker
-
- saveTxtTo(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TFDictionary
-
- saveTxtTo(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TMDictionaryMaker
-
- saveValue(V, DataOutputStream) - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonDictionary
-
保存单个值到流中
- saveValue(EnumItem<E>, DataOutputStream) - 类 中的方法com.hankcs.hanlp.dictionary.common.EnumItemDictionary
-
- scanner - 类 中的变量com.hankcs.hanlp.mining.word2vec.AbstractClosestVectors
-
- score - 类 中的变量com.hankcs.hanlp.corpus.occurrence.PairFrequency
-
分数
- score - 类 中的变量com.hankcs.hanlp.dependency.perceptron.transition.configuration.BeamElement
-
- score - 类 中的变量com.hankcs.hanlp.dependency.perceptron.transition.configuration.Configuration
-
- score(int[], int) - 类 中的方法com.hankcs.hanlp.model.perceptron.model.LinearModel
-
通过命中的特征函数计算得分
- scorePath - 类 中的变量com.hankcs.hanlp.dependency.perceptron.accessories.Options
-
- Searcher(int, char[]) - 类 的构造器com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher
-
构造一个双数组搜索工具
- Searcher(char[]) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Searcher
-
- Searcher(String) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Searcher
-
- Searcher(char[], DoubleArrayTrie<Character>) - 类 的构造器com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary.Searcher
-
- Searcher(String, DoubleArrayTrie<Character>) - 类 的构造器com.hankcs.hanlp.dictionary.nr.JapanesePersonDictionary.Searcher
-
- Searcher(char[], DoubleArrayTrie<Pinyin[]>) - 类 的构造器com.hankcs.hanlp.dictionary.py.PinyinDictionary.Searcher
-
- Searcher(String, DoubleArrayTrie<Pinyin[]>) - 类 的构造器com.hankcs.hanlp.dictionary.py.PinyinDictionary.Searcher
-
- Searcher(char[], DoubleArrayTrie<String>) - 类 的构造器com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary.Searcher
-
- Searcher(String, DoubleArrayTrie<String>) - 类 的构造器com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary.Searcher
-
- second - 类 中的变量com.hankcs.hanlp.collection.dartsclone.Pair
-
- second - 类 中的变量com.hankcs.hanlp.corpus.occurrence.PairFrequency
-
- second - 类 中的变量com.hankcs.hanlp.dependency.perceptron.accessories.Pair
-
- SecondOrderHiddenMarkovModel - com.hankcs.hanlp.model.hmm中的类
-
- SecondOrderHiddenMarkovModel(float[], float[][], float[][], float[][][]) - 类 的构造器com.hankcs.hanlp.model.hmm.SecondOrderHiddenMarkovModel
-
- SecondOrderHiddenMarkovModel() - 类 的构造器com.hankcs.hanlp.model.hmm.SecondOrderHiddenMarkovModel
-
- seg(String) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
分词
此方法是线程安全的
- seg(char[]) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
分词
- seg(String) - 类 中的方法com.hankcs.hanlp.seg.SegmentPipeline
-
- seg2sentence(String) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
分词断句 输出句子形式
- seg2sentence(String, boolean) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
分词断句 输出句子形式
- seg2sentence(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.BasicTokenizer
-
切分为句子形式
- seg2sentence(String, boolean) - 类 中的静态方法com.hankcs.hanlp.tokenizer.BasicTokenizer
-
分词断句 输出句子形式
- seg2sentence(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.IndexTokenizer
-
切分为句子形式
- seg2sentence(String, boolean) - 类 中的静态方法com.hankcs.hanlp.tokenizer.IndexTokenizer
-
分词断句 输出句子形式
- seg2sentence(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.NLPTokenizer
-
切分为句子形式
- seg2sentence(String, boolean) - 类 中的静态方法com.hankcs.hanlp.tokenizer.NLPTokenizer
-
分词断句 输出句子形式
- seg2sentence(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.NotionalTokenizer
-
切分为句子形式
- seg2sentence(String, boolean) - 类 中的静态方法com.hankcs.hanlp.tokenizer.NotionalTokenizer
-
分词断句 输出句子形式
- seg2sentence(String, Filter...) - 类 中的静态方法com.hankcs.hanlp.tokenizer.NotionalTokenizer
-
切分为句子形式
- seg2sentence(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.SpeedTokenizer
-
切分为句子形式
- seg2sentence(String, boolean) - 类 中的静态方法com.hankcs.hanlp.tokenizer.SpeedTokenizer
-
分词断句 输出句子形式
- seg2sentence(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.StandardTokenizer
-
切分为句子形式
- seg2sentence(String, boolean) - 类 中的静态方法com.hankcs.hanlp.tokenizer.StandardTokenizer
-
分词断句 输出句子形式
- seg2sentence(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer
-
切分为句子形式
- seg2sentence(String, boolean) - 类 中的静态方法com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer
-
分词断句 输出句子形式
- segLongest(char[], AhoCorasickDoubleArrayTrie<Pinyin[]>) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinDictionary
-
用最长分词算法匹配拼音
- segLongest(char[], AhoCorasickDoubleArrayTrie<Pinyin[]>, boolean) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.PinyinDictionary
-
- segLongest(char[], DoubleArrayTrie<String>) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary
-
- segLongest(char[], AhoCorasickDoubleArrayTrie<String>) - 类 中的静态方法com.hankcs.hanlp.dictionary.ts.BaseChineseDictionary
-
- segment(String) - 类 中的方法com.hankcs.hanlp.classification.tokenizers.BigramTokenizer
-
- segment(String) - 类 中的方法com.hankcs.hanlp.classification.tokenizers.BlankTokenizer
-
- segment(String) - 类 中的方法com.hankcs.hanlp.classification.tokenizers.HanLPTokenizer
-
- segment(String) - 接口 中的方法com.hankcs.hanlp.classification.tokenizers.ITokenizer
-
- segment(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
分词
- segment - 类 中的变量com.hankcs.hanlp.mining.cluster.ClusterAnalyzer
-
- segment(String) - 类 中的方法com.hankcs.hanlp.model.crf.CRFSegmenter
-
- segment(String, String, List<String>) - 类 中的方法com.hankcs.hanlp.model.crf.CRFSegmenter
-
- segment(String) - 类 中的方法com.hankcs.hanlp.model.hmm.HMMSegmenter
-
- segment(String, String, List<String>) - 类 中的方法com.hankcs.hanlp.model.hmm.HMMSegmenter
-
- segment(String, List<String>) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronLexicalAnalyzer
-
中文分词
- segment(String, List<String>) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronSegmenter
-
- segment(String, String, List<String>) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronSegmenter
-
- segment(String, Instance, List<String>) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronSegmenter
-
- segment(String) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronSegmenter
-
- segment(String) - 类 中的方法com.hankcs.hanlp.seg.Other.CommonAhoCorasickDoubleArrayTrieSegment
-
- segment(char[]) - 类 中的方法com.hankcs.hanlp.seg.Other.CommonAhoCorasickDoubleArrayTrieSegment
-
- segment(String, AhoCorasickDoubleArrayTrie<V>) - 类 中的静态方法com.hankcs.hanlp.seg.Other.CommonAhoCorasickSegmentUtil
-
最长分词,合并未知语素
- segment(char[], AhoCorasickDoubleArrayTrie<V>) - 类 中的静态方法com.hankcs.hanlp.seg.Other.CommonAhoCorasickSegmentUtil
-
最长分词,合并未知语素
- Segment - com.hankcs.hanlp.seg中的类
-
分词器(分词服务)
是所有分词器的基类(Abstract)
分词器的分词方法是线程安全的,但配置方法则不保证
- Segment() - 类 的构造器com.hankcs.hanlp.seg.Segment
-
构造一个分词器
- SEGMENT - 类 中的静态变量com.hankcs.hanlp.tokenizer.BasicTokenizer
-
预置分词器
- segment(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.BasicTokenizer
-
分词
- segment(char[]) - 类 中的静态方法com.hankcs.hanlp.tokenizer.BasicTokenizer
-
分词
- SEGMENT - 类 中的静态变量com.hankcs.hanlp.tokenizer.IndexTokenizer
-
预置分词器
- segment(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.IndexTokenizer
-
- segment(char[]) - 类 中的静态方法com.hankcs.hanlp.tokenizer.IndexTokenizer
-
分词
- segment(String, String, List<String>, List<CoreDictionary.Attribute>) - 类 中的方法com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
分词
- segment(String, String, List<String>) - 类 中的方法com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
- segment(String) - 类 中的方法com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
中文分词
- segment(String, String) - 类 中的方法com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
这个方法会查询用户词典
- segment(String) - 接口 中的方法com.hankcs.hanlp.tokenizer.lexical.Segmenter
-
中文分词
- segment(String, String, List<String>) - 接口 中的方法com.hankcs.hanlp.tokenizer.lexical.Segmenter
-
- segment(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.NLPTokenizer
-
- segment(char[]) - 类 中的静态方法com.hankcs.hanlp.tokenizer.NLPTokenizer
-
分词
- SEGMENT - 类 中的静态变量com.hankcs.hanlp.tokenizer.NotionalTokenizer
-
预置分词器
- segment(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.NotionalTokenizer
-
- segment(char[]) - 类 中的静态方法com.hankcs.hanlp.tokenizer.NotionalTokenizer
-
分词
- segment(String, String, List<String>) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.LexicalAnalyzerPipeline
-
- segment(String) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.LexicalAnalyzerPipeline
-
- SEGMENT - 类 中的静态变量com.hankcs.hanlp.tokenizer.SpeedTokenizer
-
预置分词器
- segment(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.SpeedTokenizer
-
- segment(char[]) - 类 中的静态方法com.hankcs.hanlp.tokenizer.SpeedTokenizer
-
分词
- SEGMENT - 类 中的静态变量com.hankcs.hanlp.tokenizer.StandardTokenizer
-
预置分词器
- segment(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.StandardTokenizer
-
分词
- segment(char[]) - 类 中的静态方法com.hankcs.hanlp.tokenizer.StandardTokenizer
-
分词
- SEGMENT - 类 中的静态变量com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer
-
预置分词器
- segment(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer
-
- segment(char[]) - 类 中的静态方法com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer
-
分词
- SEGMENT - 类 中的静态变量com.hankcs.hanlp.tokenizer.URLTokenizer
-
预置分词器
- segment(String) - 类 中的静态方法com.hankcs.hanlp.tokenizer.URLTokenizer
-
分词
- segmentAfterRule(String, String, List<String>) - 类 中的方法com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
丑陋的规则系统
- segmenter - 类 中的变量com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
- Segmenter - com.hankcs.hanlp.tokenizer.lexical中的接口
-
分词器接口
- SegmentPipeline - com.hankcs.hanlp.seg中的类
-
- SegmentPipeline(Segment) - 类 的构造器com.hankcs.hanlp.seg.SegmentPipeline
-
- segmentReverseOrder(String, AhoCorasickDoubleArrayTrie<V>) - 类 中的静态方法com.hankcs.hanlp.seg.Other.CommonAhoCorasickSegmentUtil
-
逆向最长分词,合并未知语素
- segmentReverseOrder(char[], AhoCorasickDoubleArrayTrie<V>) - 类 中的静态方法com.hankcs.hanlp.seg.Other.CommonAhoCorasickSegmentUtil
-
逆向最长分词,合并未知语素
- SegmentWrapper - com.hankcs.hanlp.seg.common.wrapper中的类
-
一个将BufferedReader wrap进来的类
- SegmentWrapper(BufferedReader, Segment) - 类 的构造器com.hankcs.hanlp.seg.common.wrapper.SegmentWrapper
-
- segSentence(char[]) - 类 中的方法com.hankcs.hanlp.seg.CharacterBasedSegment
-
以下方法用于纯分词模型
分词、词性标注联合模型则直接重载segSentence
- segSentence(char[]) - 类 中的方法com.hankcs.hanlp.seg.Dijkstra.DijkstraSegment
-
- segSentence(char[]) - 类 中的方法com.hankcs.hanlp.seg.NShort.NShortSegment
-
- segSentence(char[]) - 类 中的方法com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment
-
- segSentence(char[]) - 类 中的方法com.hankcs.hanlp.seg.Other.DoubleArrayTrieSegment
-
- segSentence(char[]) - 类 中的方法com.hankcs.hanlp.seg.Segment
-
给一个句子分词
- segSentence(char[]) - 类 中的方法com.hankcs.hanlp.seg.SegmentPipeline
-
- segSentence(char[]) - 类 中的方法com.hankcs.hanlp.seg.Viterbi.ViterbiSegment
-
- segSentence(char[]) - 类 中的方法com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
- selectFeatures(IDataSet) - 类 中的方法com.hankcs.hanlp.classification.classifiers.NaiveBayesClassifier
-
统计特征并且执行特征选择,返回一个FeatureStats对象,用于计算模型中的概率
- Sentence - com.hankcs.hanlp.corpus.document.sentence中的类
-
句子,指的是以。!
- Sentence(List<IWord>) - 类 的构造器com.hankcs.hanlp.corpus.document.sentence.Sentence
-
- Sentence - com.hankcs.hanlp.dependency.perceptron.structures中的类
-
CoNLL中的一个句子
- Sentence(ArrayList<Integer>, ArrayList<Integer>, ArrayList<Integer>, ArrayList<Integer>, ArrayList<Integer>) - 类 的构造器com.hankcs.hanlp.dependency.perceptron.structures.Sentence
-
- sentence - 类 中的变量com.hankcs.hanlp.dependency.perceptron.transition.configuration.Configuration
-
- sentence - 类 中的变量com.hankcs.hanlp.dependency.perceptron.transition.configuration.Instance
-
- sentence - 类 中的变量com.hankcs.hanlp.seg.common.WordNet
-
- sentenceList - 类 中的变量com.hankcs.hanlp.corpus.document.Document
-
- SentencesUtil - com.hankcs.hanlp.utility中的类
-
文本断句
- SentencesUtil() - 类 的构造器com.hankcs.hanlp.utility.SentencesUtil
-
- separator - 类 中的变量com.hankcs.hanlp.corpus.dictionary.StringDictionary
-
key value之间的分隔符
- separator - 类 中的变量com.hankcs.hanlp.dependency.perceptron.accessories.Options
-
- SEPERATOR_C_SENTENCE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
- SEPERATOR_C_SUB_SENTENCE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
- SEPERATOR_E_SENTENCE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
- SEPERATOR_E_SUB_SENTENCE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
- SEPERATOR_LINK - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
- serializeTo(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
将自己序列化到
- set(String, V) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
-
更新某个键对应的值
- set(String, V) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
-
设置键值对,当键不存在的时候会自动插入
- set(int, int) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.IntArrayList
-
- set(String, int) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
设置键值 (同put)
- set(String, V) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
更新某个键对应的值
- set(int, int, double) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Set a single element.
- set(int, float) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.structures.CompactArray
-
将index处的元素设置为value
- set(char, byte) - 类 中的静态方法com.hankcs.hanlp.dictionary.other.CharType
-
设置字符类型
- set(int, Pipe<List<IWord>, List<IWord>>) - 类 中的方法com.hankcs.hanlp.seg.SegmentPipeline
-
- set(int, Pipe<M, M>) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.Pipeline
-
- set_node(Node, int, int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- setAcceptStateStatus(boolean) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
Sets this node's accept state status.
- setALevel(double) - 类 中的方法com.hankcs.hanlp.classification.features.ChiSquareFeatureExtractor
-
- setAllowOverlaps(boolean) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.TrieConfig
-
设置是否允许重叠
- setAlpha(float) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- setAlpha_(double[]) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- setAlphaFloat_(float[]) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- setAnswer_(List<Integer>) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- setAttribute(String, CoreDictionary.Attribute) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
-
设置某个单词的属性
- setAttribute(String, Nature...) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
-
设置某个单词的属性
- setAttribute(String, String...) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
-
设置某个单词的属性
- setAttribute(String, String) - 类 中的静态方法com.hankcs.hanlp.utility.LexiconUtility
-
设置某个单词的属性
- setBase(int[]) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- setBigramTempls_(List<String>) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- setBoost(double) - 类 中的方法com.hankcs.hanlp.suggest.scorer.BaseScorer
-
设置权重
- setBufferHead(int) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
- setCallback(TrainingCallback) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- setCallback(TrainingCallback) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Word2VecTrainer
-
设置训练回调
- setCheck(int[]) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- setChisquareCriticalValue(double) - 类 中的方法com.hankcs.hanlp.classification.features.ChiSquareFeatureExtractor
-
设置卡方临界值
- setCn(int) - 类 中的方法com.hankcs.hanlp.mining.word2vec.VocabWord
-
- setConfig(String[], Config) - 类 中的方法com.hankcs.hanlp.mining.word2vec.AbstractTrainer
-
- setCorrectionParam(double) - 类 中的方法com.hankcs.hanlp.model.maxent.EvalParameters
-
- setCost_(double) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- setCostFactor_(double) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- setDat(DoubleArrayTrie<CoreDictionary.Attribute>) - 类 中的方法com.hankcs.hanlp.seg.Viterbi.ViterbiSegment
-
- setDeprelTranslater(String) - 类 中的方法com.hankcs.hanlp.dependency.AbstractDependencyParser
-
设置映射表
- setDeprelTranslator(Map<String, String>) - 类 中的方法com.hankcs.hanlp.dependency.AbstractDependencyParser
-
- setDeprelTranslator(Map<String, String>) - 接口 中的方法com.hankcs.hanlp.dependency.IDependencyParser
-
设置依存关系映射表
- setDownSamplingRate(float) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Word2VecTrainer
-
设置高频词的下采样频率(高频词频率一旦高于此频率,训练时将被随机忽略),在不使用停用词词典的情况下,停用词就符合高频词的标准
默认 1e-3, 常用取值区间为 (0, 1e-5)
- setElementArray(float[]) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Vector
-
- setEmptyFlag(boolean) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
- setExponentialExpandFactor(double) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.IntArrayList
-
- setExponentialExpandFactor(double) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
指数膨胀的底数
- setExponentialExpanding(boolean) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.IntArrayList
-
- setExponentialExpanding(boolean) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
激活指数膨胀
- setFailure(State) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
-
设置failure状态
- setFailure(State, int[]) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
-
设置failure状态
- setFeature_id_(int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- setFeature_index_(FeatureIndex) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- setFeatureCache_(List<List<Integer>>) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- setFeatureIndex_(DecoderFeatureIndex) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.ModelImpl
-
- setFirst(T1) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.accessories.Pair
-
- setFrom(Vertex) - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
-
- setIndex(int) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
-
- setInitialLearningRate(float) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Word2VecTrainer
-
设置初始学习率
skip-gram 默认 0.025 ,CBOW 默认 0.05
- setInputFile(String) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- setIter(int) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- setKey(List<String>) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- setLabel(String) - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
-
- setLabel(String) - 接口 中的方法com.hankcs.hanlp.corpus.document.sentence.word.IWord
-
设置标签
- setLabel(String) - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.Word
-
- setLabels(String[]) - 类 中的方法com.hankcs.hanlp.model.maxent.UniformPrior
-
初始化
- setLast(int) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.IntArrayList
-
- setLast(int, String) - 类 中的方法com.hankcs.hanlp.model.crf.Table
-
- setLayer1Size(int) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- setLayerSize(int) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Word2VecTrainer
-
词向量的维度(等同于神经网络模型隐藏层的大小)
默认 100
- setLength(int[]) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- setLinearExpandFactor(int) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.IntArrayList
-
- setLinearExpandFactor(int) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
设置线性膨胀
- setMatrix(int, int, int, int, Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Set a submatrix.
- setMatrix(int[], int[], Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Set a submatrix.
- setMatrix(int[], int, int, Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Set a submatrix.
- setMatrix(int, int, int[], Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Set a submatrix.
- setMax_xsize_(int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- setMaxid_(int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- setMaxSentenceSize(int) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
- setMinCount(int) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- setMinVocabFrequency(int) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Word2VecTrainer
-
最低词频,低于此数值将被过滤掉
默认 5
- setMode_(TaggerImpl.Mode) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- setModel(ModelImpl) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- setNbest_(int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.ModelImpl
-
- setNbest_(int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- setNegative(int) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- setNode_(List<List<Node>>) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- setNodeList_(List<List<Node>>) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- setNumIterations(int) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Word2VecTrainer
-
设置迭代次数
- setNumThreads(int) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- setOutputFile(String) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- setPathList_(List<List<Path>>) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- setPenalty(int, int, double) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Tagger
-
- setPenalty(int, int, double) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- setRealWord(String) - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
-
- setResult_(List<Integer>) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- setSample(float) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- setScore(float) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.Configuration
-
- setSegment(Segment) - 类 中的方法com.hankcs.hanlp.dependency.AbstractDependencyParser
-
- setSegment(Segment) - 接口 中的方法com.hankcs.hanlp.dependency.IDependencyParser
-
设置Parser使用的分词器
- setSegment(Segment) - 类 中的方法com.hankcs.hanlp.summary.KeywordExtractor
-
设置关键词提取器使用的分词器
- setSize(int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- setStaticFinalField(Field, Object) - 类 中的静态方法com.hankcs.hanlp.corpus.util.ReflectionHelper
-
- setThread_id_(int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- setThreadNum_(int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- setTokenizer(ITokenizer) - 类 中的方法com.hankcs.hanlp.classification.corpus.AbstractDataSet
-
- setTokenizer(ITokenizer) - 接口 中的方法com.hankcs.hanlp.classification.corpus.IDataSet
-
设置分词器
- setTransitionSetBeginIndex(int) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
转移状态在数组中的起始下标
Records the index that this node's _transition set starts at
in an array containing this node's containing MDAG data (simplified MDAG).
- setTransitionSetBeginIndex(int) - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
-
Records the index in this node's containing array that its _transition set begins at.
- setTrie(AhoCorasickDoubleArrayTrie<CoreDictionary.Attribute>) - 类 中的方法com.hankcs.hanlp.seg.Other.AhoCorasickDoubleArrayTrieSegment
-
- setUnigramTempls_(List<String>) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- setUseContinuousBagOfWords(boolean) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- setUseHierarchicalSoftmax(boolean) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- setValue(V[]) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie._ValueArray
-
- setValue(V) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
-
设置节点对应的值
- setValue(int) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger.KeyValuePair
-
- setValue(String) - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
-
- setValue(String) - 接口 中的方法com.hankcs.hanlp.corpus.document.sentence.word.IWord
-
设置单词
- setValue(String) - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.Word
-
- setValue(int[]) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.DoubleArrayTrieInteger
-
- setVlevel_(int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.ModelImpl
-
- setVlevel_(int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- setWindow(int) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Config
-
- setWindowSize(int) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Word2VecTrainer
-
窗口大小
默认 5
- setWord(String) - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
-
- setX_(List<List<String>>) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- setXsize_(int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- setY_(List<String>) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- setYsize_(int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- setZ_(double) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- setZero() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
- Shengmu - com.hankcs.hanlp.dictionary.py中的枚举
-
声母
- shift(State) - 类 中的静态方法com.hankcs.hanlp.dependency.perceptron.transition.parser.ArcEager
-
- shiftFeatureAveragedWeights - 类 中的变量com.hankcs.hanlp.dependency.perceptron.learning.AveragedPerceptron
-
This is the main part of the extension to the original perceptron algorithm which the averaging over all the history
- shiftFeatureAveragedWeights - 类 中的变量com.hankcs.hanlp.dependency.perceptron.structures.ParserModel
-
- shiftFeatureWeights - 类 中的变量com.hankcs.hanlp.dependency.perceptron.learning.AveragedPerceptron
-
For the weights for all features
- shiftScore(Object[], boolean) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.learning.AveragedPerceptron
-
- shouldInclude(Term) - 类 中的静态方法com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary
-
是否应当将这个term纳入计算
- shouldInclude(Term) - 接口 中的方法com.hankcs.hanlp.dictionary.stopword.Filter
-
是否应当将这个term纳入计算
- shouldInclude(Term) - 类 中的方法com.hankcs.hanlp.dictionary.stopword.StopWordDictionary
-
- shouldInclude(Term) - 类 中的方法com.hankcs.hanlp.summary.KeywordExtractor
-
是否应当将这个term纳入计算,词性属于名词、动词、副词、形容词
- shouldRemove(Term) - 类 中的静态方法com.hankcs.hanlp.dictionary.stopword.CoreStopWordDictionary
-
是否应当去掉这个词
- showHelp - 类 中的变量com.hankcs.hanlp.dependency.perceptron.accessories.Options
-
- showHelp() - 类 中的静态方法com.hankcs.hanlp.dependency.perceptron.accessories.Options
-
- ShowTermNature - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
-
分词结果是否展示词性
- shrink(int[]) - 类 中的方法com.hankcs.hanlp.classification.corpus.FileDataSet
-
- shrink(int[]) - 接口 中的方法com.hankcs.hanlp.classification.corpus.IDataSet
-
- shrink(int[]) - 类 中的方法com.hankcs.hanlp.classification.corpus.MemoryDataSet
-
- shrink(int, List<TaggerImpl>) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.EncoderFeatureIndex
-
- shrink() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- shrinking_size - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.crf_learn.Option
-
- shuffleArray(int[]) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.utility.Utility
-
Fisher–Yates shuffle
- shuffleArray(T[]) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.utility.Utility
-
- shutdown() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Corpus
-
- shutdown() - 类 中的方法com.hankcs.hanlp.mining.word2vec.TextFileCorpus
-
- shutDownLiveThreads() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.parser.KBeamArcEagerParser
-
- sigma(double) - 类 中的静态方法com.hankcs.hanlp.model.crf.crfpp.Mcsrch
-
- sigMoid(float) - 类 中的静态方法com.hankcs.hanlp.summary.TextRankKeyword
-
sigmoid函数
- sim(List<String>, int) - 类 中的方法com.hankcs.hanlp.summary.BM25
-
计算一个句子与一个文档的BM25相似度
- simAll(List<String>) - 类 中的方法com.hankcs.hanlp.summary.BM25
-
- similar(HiddenMarkovModel) - 类 中的方法com.hankcs.hanlp.model.hmm.HiddenMarkovModel
-
- similar(float[], float[]) - 类 中的静态方法com.hankcs.hanlp.model.hmm.HiddenMarkovModel
-
- similar(HiddenMarkovModel) - 类 中的方法com.hankcs.hanlp.model.hmm.SecondOrderHiddenMarkovModel
-
- similarity(String, String) - 类 中的静态方法com.hankcs.hanlp.dictionary.CoreSynonymDictionary
-
计算两个单词之间的相似度,0表示不相似,1表示完全相似
- similarity(K, K) - 类 中的方法com.hankcs.hanlp.mining.word2vec.AbstractVectorModel
-
余弦相似度
- similarity(String, String) - 类 中的方法com.hankcs.hanlp.mining.word2vec.DocVectorModel
-
文档相似度计算
- similarity(CharArray) - 类 中的方法com.hankcs.hanlp.suggest.scorer.editdistance.CharArray
-
- similarity(T) - 接口 中的方法com.hankcs.hanlp.suggest.scorer.ISentenceKey
-
- similarity(IdVector) - 类 中的方法com.hankcs.hanlp.suggest.scorer.lexeme.IdVector
-
- similarity(PinyinKey) - 类 中的方法com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey
-
- simpleAtomSegment(char[], int, int) - 类 中的静态方法com.hankcs.hanlp.seg.Segment
-
简易原子分词,将所有字放到一起作为一个词
- SimpleDictionary<V> - com.hankcs.hanlp.corpus.dictionary中的类
-
可以调整大小的词典
- SimpleDictionary() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.SimpleDictionary
-
- SimpleDictionary.Filter<V> - com.hankcs.hanlp.corpus.dictionary中的接口
-
- SimpleItem - com.hankcs.hanlp.corpus.dictionary.item中的类
-
- SimpleItem() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
-
- SimpleMDAGNode - com.hankcs.hanlp.collection.MDAG中的类
-
The class capable of representing a MDAG node, its _transition set, and one of its incoming transitions;
objects of this class are used to represent a MDAG after its been simplified in order to save space.
- SimpleMDAGNode(char, boolean, int) - 类 的构造器com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
-
Constructs a SimpleMDAGNode.
- SimpleMDAGNode() - 类 的构造器com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
-
- SimplifiedChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
-
简体=繁体词典
- SimplifiedChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.SimplifiedChineseDictionary
-
- simplifiedSourceNode - 类 中的变量com.hankcs.hanlp.collection.MDAG.MDAG
-
简化后的根节点(简化指的是用数组简化,而不是最小化,这个结构永远是最小化的)
- SimplifiedToHongKongChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
-
简体转香港繁体繁体
- SimplifiedToHongKongChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.SimplifiedToHongKongChineseDictionary
-
- SimplifiedToTaiwanChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
-
简体转台湾繁体
- SimplifiedToTaiwanChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.SimplifiedToTaiwanChineseDictionary
-
- simplify() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAG
-
固化自己
Creates a space-saving version of the MDAG in the form of an array.
- simplify() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGMap
-
进一步降低内存,提高查询速度
副作用是下次插入速度会变慢
- size() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Interval
-
- size() - 接口 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Intervalable
-
长度
- size() - 类 中的方法com.hankcs.hanlp.algorithm.MaxHeap
-
- size() - 类 中的方法com.hankcs.hanlp.classification.corpus.Catalog
-
- size() - 类 中的方法com.hankcs.hanlp.classification.corpus.FileDataSet
-
- size() - 接口 中的方法com.hankcs.hanlp.classification.corpus.IDataSet
-
数据集的样本大小
- size() - 类 中的方法com.hankcs.hanlp.classification.corpus.Lexicon
-
- size() - 类 中的方法com.hankcs.hanlp.classification.corpus.MemoryDataSet
-
- size - 类 中的变量com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
-
base 和 check 的大小
- size() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
-
大小,即包含多少个模式串
- size() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DoubleArray
-
大小
- size() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
-
- size() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BinTrie
-
- size() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.IntArrayList
-
- size() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrie
-
- size() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
键值对个数
- size - 类 中的变量com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
base 和 check 的大小
- size() - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
树叶子节点个数
- size() - 接口 中的方法com.hankcs.hanlp.collection.trie.ITrie
-
- size() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.SimpleDictionary
-
- size() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.Sentence
-
句子中单词(复合词或简单词)的数量
- size() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Alphabet
-
字母表大小
- size() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.structures.Sentence
-
- size() - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonDictionary
-
词典大小
- size() - 类 中的方法com.hankcs.hanlp.mining.word.TermFrequencyCounter
-
- size() - 类 中的方法com.hankcs.hanlp.mining.word2vec.AbstractVectorModel
-
模型中的词向量总数(词表大小)
- size() - 类 中的方法com.hankcs.hanlp.mining.word2vec.Vector
-
- size - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.CRFEncoderThread
-
- size() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- size() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Tagger
-
- size() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- size() - 类 中的方法com.hankcs.hanlp.model.crf.Table
-
- size() - 类 中的方法com.hankcs.hanlp.model.perceptron.feature.FeatureMap
-
- size() - 类 中的方法com.hankcs.hanlp.model.perceptron.feature.ImmutableFeatureDatMap
-
- size() - 类 中的方法com.hankcs.hanlp.model.perceptron.feature.ImmutableFeatureMap
-
- size() - 类 中的方法com.hankcs.hanlp.model.perceptron.feature.ImmutableFeatureMDatMap
-
- size() - 类 中的方法com.hankcs.hanlp.model.perceptron.feature.MutableFeatureMap
-
- size() - 类 中的方法com.hankcs.hanlp.model.perceptron.instance.Instance
-
实例大小(有多少个要预测的元素)
- size() - 类 中的方法com.hankcs.hanlp.model.perceptron.tagset.TagSet
-
- size() - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
-
- size() - 类 中的方法com.hankcs.hanlp.seg.SegmentPipeline
-
- size() - 类 中的方法com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey
-
拼音的个数
- size() - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.Pipeline
-
- sizeIncludingBos() - 类 中的方法com.hankcs.hanlp.model.perceptron.tagset.TagSet
-
- sortBeam(ArrayList<Configuration>, TreeSet<BeamElement>, Boolean, Instance, int, boolean, int, AveragedPerceptron, Collection<Integer>) - 类 中的静态方法com.hankcs.hanlp.dependency.perceptron.transition.parser.ParseThread
-
- sortDictionary(String) - 类 中的静态方法com.hankcs.hanlp.corpus.util.DictionaryUtil
-
给某个字典排序
- sortedAllTf() - 类 中的方法com.hankcs.hanlp.mining.word.TfIdfCounter
-
- sortedAllTfInt() - 类 中的方法com.hankcs.hanlp.mining.word.TfIdfCounter
-
- sortMapByValue(Map<K, V>, boolean) - 类 中的静态方法com.hankcs.hanlp.classification.utilities.CollectionUtility
-
- sortMapByValue(Map<K, V>) - 类 中的静态方法com.hankcs.hanlp.classification.utilities.CollectionUtility
-
- sourceNode - 类 中的变量com.hankcs.hanlp.collection.MDAG.MDAG
-
根节点
- SparseVector - com.hankcs.hanlp.mining.cluster中的类
-
- SparseVector() - 类 的构造器com.hankcs.hanlp.mining.cluster.SparseVector
-
- SpecialOption - com.hankcs.hanlp.dependency.nnparser.option中的类
-
- SpecialOption() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.option.SpecialOption
-
- speechTagging - 类 中的变量com.hankcs.hanlp.seg.Config
-
词性标注
- speechTagging(List<Vertex>) - 类 中的静态方法com.hankcs.hanlp.seg.WordBasedSegment
-
词性标注
- speed - 类 中的变量com.hankcs.hanlp.classification.statistics.evaluations.FMeasure
-
速度
- SpeedTokenizer - com.hankcs.hanlp.tokenizer中的类
-
极速分词,基于Double Array Trie实现的词典分词,适用于“高吞吐量”“精度一般”的场合
- SpeedTokenizer() - 类 的构造器com.hankcs.hanlp.tokenizer.SpeedTokenizer
-
- spilt(List<IWord>) - 类 中的静态方法com.hankcs.hanlp.corpus.util.CorpusUtil
-
- spiltArray(String[], double) - 类 中的静态方法com.hankcs.hanlp.classification.utilities.CollectionUtility
-
分割数组为两个数组
- splitMap(Map<String, String[]>, double) - 类 中的静态方法com.hankcs.hanlp.classification.utilities.CollectionUtility
-
分割Map,其中旧map直接被改变
- SString - com.hankcs.hanlp.collection.sequence中的类
-
(SimpleString)字符串,因为String内部的char[]无法访问,而许多任务经常操作char[],所以封装了这个结构。
- SString(char[], int, int) - 类 的构造器com.hankcs.hanlp.collection.sequence.SString
-
建立一个字符串
- SString(String) - 类 的构造器com.hankcs.hanlp.collection.sequence.SString
-
- stack - 类 中的变量com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
- stackEmpty() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
- stackSize() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
- stackTop() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
View top element of stack
- StandardTokenizer - com.hankcs.hanlp.tokenizer中的类
-
标准分词器
- StandardTokenizer() - 类 的构造器com.hankcs.hanlp.tokenizer.StandardTokenizer
-
- start(String, Object...) - 类 中的方法com.hankcs.hanlp.classification.utilities.io.ConsoleLogger
-
- start(String, Object...) - 接口 中的方法com.hankcs.hanlp.classification.utilities.io.ILogger
-
- start_i - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.CRFEncoderThread
-
- start_probability - 类 中的变量com.hankcs.hanlp.dictionary.TransformMatrix
-
初始概率
- startsWith(String) - 类 中的方法com.hankcs.hanlp.corpus.tag.Nature
-
词性是否以该前缀开头
词性根据开头的几个字母可以判断大的类别
- startsWith(char) - 类 中的方法com.hankcs.hanlp.corpus.tag.Nature
-
词性是否以该前缀开头
词性根据开头的几个字母可以判断大的类别
- State - com.hankcs.hanlp.algorithm.ahocorasick.trie中的类
-
一个状态有如下几个功能
success; 成功转移到另一个状态
failure; 不可顺着字符串跳转的话,则跳转到一个浅一点的节点
emits; 命中一个模式串
根节点稍有不同,根节点没有 failure 功能,它的“failure”指的是按照字符串路径转移到下一个状态。
- State() - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.State
-
构造深度为0的节点
- State(int) - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.State
-
构造深度为depth的节点
- State - com.hankcs.hanlp.collection.AhoCorasick中的类
-
一个状态有如下几个功能
success; 成功转移到另一个状态
failure; 不可顺着字符串跳转的话,则跳转到一个浅一点的节点
emits; 命中一个模式串
根节点稍有不同,根节点没有 failure 功能,它的“failure”指的是按照字符串路径转移到下一个状态。
- State() - 类 的构造器com.hankcs.hanlp.collection.AhoCorasick.State
-
构造深度为0的节点
- State(int) - 类 的构造器com.hankcs.hanlp.collection.AhoCorasick.State
-
构造深度为depth的节点
- State - com.hankcs.hanlp.dependency.common中的类
-
- State(float, int, Edge) - 类 的构造器com.hankcs.hanlp.dependency.common.State
-
- State - com.hankcs.hanlp.dependency.nnparser中的类
-
- State() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.State
-
- State(Dependency) - 类 的构造器com.hankcs.hanlp.dependency.nnparser.State
-
- state - 类 中的变量com.hankcs.hanlp.dependency.perceptron.transition.configuration.Configuration
-
- State - com.hankcs.hanlp.dependency.perceptron.transition.configuration中的类
-
由buffer、stack和arc组成的状态
- State(int) - 类 的构造器com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
- State(int, boolean) - 类 的构造器com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
- State - com.hankcs.hanlp.seg.Dijkstra.Path中的类
-
- State(double, int) - 类 的构造器com.hankcs.hanlp.seg.Dijkstra.Path.State
-
- states - 类 中的变量com.hankcs.hanlp.dictionary.TransformMatrix
-
隐状态
- stateValue(int) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
- status - 类 中的变量com.hankcs.hanlp.collection.trie.bintrie.BaseNode
-
节点状态
- std - com.hankcs.hanlp.dependency.nnparser.util中的类
-
- std() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.util.std
-
- StopWordDictionary - com.hankcs.hanlp.dictionary.stopword中的类
-
- StopWordDictionary(File) - 类 的构造器com.hankcs.hanlp.dictionary.stopword.StopWordDictionary
-
- StopWordDictionary(Collection<String>) - 类 的构造器com.hankcs.hanlp.dictionary.stopword.StopWordDictionary
-
- StopWordDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.stopword.StopWordDictionary
-
- StopWordDictionary(String) - 类 的构造器com.hankcs.hanlp.dictionary.stopword.StopWordDictionary
-
- storage - 类 中的变量com.hankcs.hanlp.suggest.scorer.BaseScorer
-
储存
- String2PinyinConverter - com.hankcs.hanlp.dictionary.py中的类
-
汉字转拼音,提供拼音字符串转拼音,支持汉英混合的杂乱文本
- String2PinyinConverter() - 类 的构造器com.hankcs.hanlp.dictionary.py.String2PinyinConverter
-
- StringDictionary - com.hankcs.hanlp.corpus.dictionary中的类
-
满足 key=value 格式的词典,其中“=”可以自定义
- StringDictionary(String) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.StringDictionary
-
- StringDictionary() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.StringDictionary
-
- StringDictionaryMaker - com.hankcs.hanlp.corpus.dictionary中的类
-
方便的工厂类
- StringDictionaryMaker() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.StringDictionaryMaker
-
- stringOf(int) - 接口 中的方法com.hankcs.hanlp.model.perceptron.common.IIdStringMap
-
- stringOf(int) - 类 中的方法com.hankcs.hanlp.model.perceptron.tagset.TagSet
-
- StructuredPerceptron - com.hankcs.hanlp.model.perceptron.model中的类
-
结构化感知机算法学习的线性模型
- StructuredPerceptron(FeatureMap, float[]) - 类 的构造器com.hankcs.hanlp.model.perceptron.model.StructuredPerceptron
-
- StructuredPerceptron(FeatureMap) - 类 的构造器com.hankcs.hanlp.model.perceptron.model.StructuredPerceptron
-
- subList(int, int) - 类 中的方法com.hankcs.hanlp.seg.SegmentPipeline
-
- subList(int, int) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.Pipeline
-
- subMap(String, String) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrie
-
- subSequence(int, int) - 类 中的方法com.hankcs.hanlp.collection.sequence.SString
-
- SuffixDictionary - com.hankcs.hanlp.corpus.dictionary中的类
-
后缀树词典
- SuffixDictionary() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.SuffixDictionary
-
- suggest(String, int) - 接口 中的方法com.hankcs.hanlp.suggest.ISuggester
-
根据一个输入的句子推荐相似的句子
- suggest(String, int) - 类 中的方法com.hankcs.hanlp.suggest.Suggester
-
- Suggester - com.hankcs.hanlp.suggest中的类
-
文本推荐器
- Suggester() - 类 的构造器com.hankcs.hanlp.suggest.Suggester
-
- Suggester(List<BaseScorer>) - 类 的构造器com.hankcs.hanlp.suggest.Suggester
-
- Suggester(BaseScorer...) - 类 的构造器com.hankcs.hanlp.suggest.Suggester
-
构造一个推荐器
- sum(int...) - 类 中的静态方法com.hankcs.hanlp.utility.MathUtility
-
- sum(float...) - 类 中的静态方法com.hankcs.hanlp.utility.MathUtility
-
- sWord - 类 中的变量com.hankcs.hanlp.seg.NShort.Path.AtomNode
-
- Synonym - com.hankcs.hanlp.corpus.synonym中的类
-
同义词
- Synonym(String, String) - 类 的构造器com.hankcs.hanlp.corpus.synonym.Synonym
-
已过时。
- Synonym(String, long) - 类 的构造器com.hankcs.hanlp.corpus.synonym.Synonym
-
已过时。
- Synonym(String, long, Synonym.Type) - 类 的构造器com.hankcs.hanlp.corpus.synonym.Synonym
-
- Synonym.Type - com.hankcs.hanlp.corpus.synonym中的枚举
-
- SynonymHelper - com.hankcs.hanlp.corpus.synonym中的类
-
一个Util
- SynonymHelper() - 类 的构造器com.hankcs.hanlp.corpus.synonym.SynonymHelper
-
- SynonymItem(Synonym, List<Synonym>, Synonym.Type) - 类 的构造器com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem
-
- SynonymItem(Synonym, List<Synonym>, char) - 类 的构造器com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem
-
- SynonymItem(Synonym, Map<String, Synonym>) - 类 的构造器com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx.SynonymItem
-
- synonymList - 类 中的变量com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem
-
条目的value,是key的同义词列表
- synonymMap - 类 中的变量com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx.SynonymItem
-
条目的value,是key的同义词近义词列表
- t - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
时间词
- t2hk(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
繁體到香港繁體
- t2s(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
- t2tw(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
繁體到臺灣正體
- T_WORD_ID - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreDictionary
-
- table - 类 中的变量com.hankcs.hanlp.mining.word2vec.Corpus
-
- Table - com.hankcs.hanlp.model.crf中的类
-
给一个实例生成一个元素表
- Table() - 类 的构造器com.hankcs.hanlp.model.crf.Table
-
- tag(Table) - 类 中的方法com.hankcs.hanlp.model.crf.CRFModel
-
维特比后向算法标注
- tag(List<String>) - 类 中的方法com.hankcs.hanlp.model.crf.CRFPOSTagger
-
- tag(String...) - 类 中的方法com.hankcs.hanlp.model.crf.CRFPOSTagger
-
- tag(Table) - 类 中的方法com.hankcs.hanlp.model.CRFSegmentModel
-
- tag(String...) - 类 中的方法com.hankcs.hanlp.model.hmm.HMMPOSTagger
-
- tag(List<String>) - 类 中的方法com.hankcs.hanlp.model.hmm.HMMPOSTagger
-
- tag(String...) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronPOSTagger
-
标注
- tag(POSInstance) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronPOSTagger
-
- tag(List<String>) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronPOSTagger
-
标注
- tag(char[]) - 类 中的方法com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel
-
序列标注
- tag(String...) - 类 中的方法com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
- tag(List<String>) - 类 中的方法com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
- tag(String...) - 接口 中的方法com.hankcs.hanlp.tokenizer.lexical.POSTagger
-
词性标注
- tag(List<String>) - 接口 中的方法com.hankcs.hanlp.tokenizer.lexical.POSTagger
-
词性标注
- tag(String...) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.LexicalAnalyzerPipeline
-
- tag(List<String>) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.LexicalAnalyzerPipeline
-
- TAG_BIGIN - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
-
- TAG_BIGIN - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
句子的开始 begin
- TAG_CLUSTER - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
-
- TAG_CLUSTER - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
字符串 x
- TAG_END - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
-
- TAG_END - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
结束 end
- TAG_GROUP - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
-
- TAG_GROUP - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
团体名词 nt
- TAG_NUMBER - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
-
- TAG_NUMBER - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
数词 m
- TAG_OTHER - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
-
- TAG_OTHER - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
其它
- TAG_PEOPLE - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
-
- TAG_PEOPLE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
人名 nr
- TAG_PLACE - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
-
- TAG_PLACE - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
地址 ns
- TAG_PROPER - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
-
- TAG_PROPER - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
专有名词 nx
- TAG_QUANTIFIER - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
数量词 mq (现在觉得应该和数词同等处理,比如一个人和一人都是合理的)
- TAG_TIME - 类 中的静态变量com.hankcs.hanlp.corpus.util.CorpusUtil
-
- TAG_TIME - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
时间 t
- tagArray - 类 中的变量com.hankcs.hanlp.model.perceptron.instance.Instance
-
- Tagger - com.hankcs.hanlp.model.crf.crfpp中的类
-
- Tagger() - 类 的构造器com.hankcs.hanlp.model.crf.crfpp.Tagger
-
- TaggerImpl - com.hankcs.hanlp.model.crf.crfpp中的类
-
- TaggerImpl(TaggerImpl.Mode) - 类 的构造器com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- TaggerImpl.Mode - com.hankcs.hanlp.model.crf.crfpp中的枚举
-
- TaggerImpl.ReadStatus - com.hankcs.hanlp.model.crf.crfpp中的枚举
-
- tags(TagSet) - 类 中的方法com.hankcs.hanlp.model.perceptron.instance.Instance
-
根据标注集还原字符形式的标签
- tags() - 类 中的方法com.hankcs.hanlp.model.perceptron.tagset.TagSet
-
- tagSet - 类 中的变量com.hankcs.hanlp.model.perceptron.feature.FeatureMap
-
- tagSet() - 类 中的方法com.hankcs.hanlp.model.perceptron.model.LinearModel
-
- tagSet - 类 中的变量com.hankcs.hanlp.model.perceptron.NERTrainer
-
支持任意自定义NER类型,例如:
tagSet.nerLabels.clear();
tagSet.nerLabels.add("nr");
tagSet.nerLabels.add("ns");
tagSet.nerLabels.add("nt");
- TagSet - com.hankcs.hanlp.model.perceptron.tagset中的类
-
- TagSet(TaskType) - 类 的构造器com.hankcs.hanlp.model.perceptron.tagset.TagSet
-
- tailMap(String) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrie
-
- TaiwanToHongKongChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
-
台湾繁体转香港繁体
- TaiwanToHongKongChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.TaiwanToHongKongChineseDictionary
-
- TaiwanToSimplifiedChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
-
台湾繁体转简体
- TaiwanToSimplifiedChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.TaiwanToSimplifiedChineseDictionary
-
- TaiwanToTraditionalChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
-
台湾繁体转繁体
- TaiwanToTraditionalChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.TaiwanToTraditionalChineseDictionary
-
- TaskType - com.hankcs.hanlp.model.perceptron.common中的枚举
-
- taskType() - 类 中的方法com.hankcs.hanlp.model.perceptron.model.LinearModel
-
- tcDictionaryRoot - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
-
简繁转换词典根目录
- templs_ - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- Term - com.hankcs.hanlp.seg.common中的类
-
一个单词,用户可以直接访问此单词的全部属性
- Term(String, Nature) - 类 的构造器com.hankcs.hanlp.seg.common.Term
-
构造一个单词
- TermFrequency - com.hankcs.hanlp.corpus.occurrence中的类
-
词与词频的简单封装
- TermFrequency(String, Integer) - 类 的构造器com.hankcs.hanlp.corpus.occurrence.TermFrequency
-
- TermFrequency(String) - 类 的构造器com.hankcs.hanlp.corpus.occurrence.TermFrequency
-
- TermFrequencyCounter - com.hankcs.hanlp.mining.word中的类
-
词频统计工具
- TermFrequencyCounter(Segment, boolean) - 类 的构造器com.hankcs.hanlp.mining.word.TermFrequencyCounter
-
构造
- TermFrequencyCounter() - 类 的构造器com.hankcs.hanlp.mining.word.TermFrequencyCounter
-
- TermOccurrence - com.hankcs.hanlp.corpus.occurrence中的类
-
词频统计
- TermOccurrence() - 类 的构造器com.hankcs.hanlp.corpus.occurrence.TermOccurrence
-
- testingDataSet - 类 中的变量com.hankcs.hanlp.classification.corpus.AbstractDataSet
-
是否属于测试集
- TestOption - com.hankcs.hanlp.dependency.nnparser.option中的类
-
- TestOption() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.option.TestOption
-
- text() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.Sentence
-
原始文本形式(无标注,raw text)
- text(String) - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.Sentence
-
原始文本形式(无标注,raw text)
- text - 类 中的变量com.hankcs.hanlp.mining.word.WordInfo
-
词语
- TextFileCorpus - com.hankcs.hanlp.mining.word2vec中的类
-
- TextFileCorpus(Config) - 类 的构造器com.hankcs.hanlp.mining.word2vec.TextFileCorpus
-
- textmodel - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.crf_learn.Option
-
- TextProcessUtility - com.hankcs.hanlp.classification.utilities中的类
-
文件预处理工具
- TextProcessUtility() - 类 的构造器com.hankcs.hanlp.classification.utilities.TextProcessUtility
-
- TextRankKeyword - com.hankcs.hanlp.summary中的类
-
基于TextRank算法的关键字提取,适用于单文档
- TextRankKeyword(Segment) - 类 的构造器com.hankcs.hanlp.summary.TextRankKeyword
-
- TextRankKeyword() - 类 的构造器com.hankcs.hanlp.summary.TextRankKeyword
-
- TextRankSentence - com.hankcs.hanlp.summary中的类
-
TextRank 自动摘要
- TextRankSentence(List<List<String>>) - 类 的构造器com.hankcs.hanlp.summary.TextRankSentence
-
- TextUtility - com.hankcs.hanlp.utility中的类
-
文本工具类
- TextUtility() - 类 的构造器com.hankcs.hanlp.utility.TextUtility
-
- tf(Collection<TERM>, TfIdf.TfType) - 类 中的静态方法com.hankcs.hanlp.mining.word.TfIdf
-
单文档词频
- tf(Collection<TERM>) - 类 中的静态方法com.hankcs.hanlp.mining.word.TfIdf
-
单文档词频
- TFDictionary - com.hankcs.hanlp.corpus.dictionary中的类
-
词频词典
- TFDictionary(String) - 类 的构造器com.hankcs.hanlp.corpus.dictionary.TFDictionary
-
- TFDictionary() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.TFDictionary
-
- TfIdf - com.hankcs.hanlp.mining.word中的类
-
词频-倒排文档词频统计
- TfIdf() - 类 的构造器com.hankcs.hanlp.mining.word.TfIdf
-
- tfIdf(Map<TERM, Double>, Map<TERM, Double>, TfIdf.Normalization) - 类 中的静态方法com.hankcs.hanlp.mining.word.TfIdf
-
计算文档的tf-idf
- tfIdf(Map<TERM, Double>, Map<TERM, Double>) - 类 中的静态方法com.hankcs.hanlp.mining.word.TfIdf
-
计算文档的tf-idf(不正规化)
- TfIdf.Normalization - com.hankcs.hanlp.mining.word中的枚举
-
tf-idf 向量的正规化算法
- TfIdf.TfType - com.hankcs.hanlp.mining.word中的枚举
-
词频统计方式
- TfIdfCounter - com.hankcs.hanlp.mining.word中的类
-
TF-IDF统计工具兼关键词提取工具
- TfIdfCounter() - 类 的构造器com.hankcs.hanlp.mining.word.TfIdfCounter
-
- TfIdfCounter(boolean) - 类 的构造器com.hankcs.hanlp.mining.word.TfIdfCounter
-
- TfIdfCounter(Segment, boolean) - 类 的构造器com.hankcs.hanlp.mining.word.TfIdfCounter
-
- TfIdfCounter(Segment) - 类 的构造器com.hankcs.hanlp.mining.word.TfIdfCounter
-
- TfIdfFeatureWeighter - com.hankcs.hanlp.classification.features中的类
-
TF-IDF权重计算
- TfIdfFeatureWeighter(int, int[]) - 类 的构造器com.hankcs.hanlp.classification.features.TfIdfFeatureWeighter
-
- tfMap - 类 中的变量com.hankcs.hanlp.classification.corpus.BagOfWordsDocument
-
- TfOnlyFeatureWeighter - com.hankcs.hanlp.classification.features中的类
-
仅仅使用TF的权重计算方式
- TfOnlyFeatureWeighter() - 类 的构造器com.hankcs.hanlp.classification.features.TfOnlyFeatureWeighter
-
- tfs(Iterable<Collection<TERM>>, TfIdf.TfType) - 类 中的静态方法com.hankcs.hanlp.mining.word.TfIdf
-
多文档词频
- tfs(Iterable<Collection<TERM>>) - 类 中的静态方法com.hankcs.hanlp.mining.word.TfIdf
-
多文档词频
- tg - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
时间词性语素
- third - 类 中的变量com.hankcs.hanlp.corpus.occurrence.TriaFrequency
-
- thread - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.crf_learn.Option
-
- threadNum - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.CRFEncoderThread
-
- threadNum_ - 类 中的变量com.hankcs.hanlp.model.crf.crfpp.FeatureIndex
-
- threadNumber - 类 中的变量com.hankcs.hanlp.seg.Config
-
并行分词的线程数
- times(double) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Multiply a matrix by a scalar, C = s*A
- times(Matrix) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Linear algebraic matrix multiplication, A * B
- timesEquals(double) - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Multiply a matrix by a scalar in place, A = s*A
- TMDictionaryMaker - com.hankcs.hanlp.corpus.dictionary中的类
-
转移矩阵词典制作工具
- TMDictionaryMaker() - 类 的构造器com.hankcs.hanlp.corpus.dictionary.TMDictionaryMaker
-
- to - 类 中的变量com.hankcs.hanlp.dependency.common.Edge
-
- to863(List<Term>) - 类 中的静态方法com.hankcs.hanlp.dependency.nnparser.util.PosTagUtil
-
转为863标注集
863词性标注集,其各个词性含义如下表:
Tag Description Example Tag Description Example
a adjective 美丽 ni organization name 保险公司
b other noun-modifier 大型, 西式 nl location noun 城郊
c conjunction 和, 虽然 ns geographical name 北京
d adverb 很 nt temporal noun 近日, 明代
e exclamation 哎 nz other proper noun 诺贝尔奖
g morpheme 茨, 甥 o onomatopoeia 哗啦
h prefix 阿, 伪 p preposition 在, 把
i idiom 百花齐放 q quantity 个
j abbreviation 公检法 r pronoun 我们
k suffix 界, 率 u auxiliary 的, 地
m number 一, 第一 v verb 跑, 学习
n general noun 苹果 wp punctuation ,。!
- toArray() - 类 中的方法com.hankcs.hanlp.classification.corpus.Catalog
-
- toArray() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
-
- toArray(T[]) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGSet
-
- toArray() - 类 中的方法com.hankcs.hanlp.mining.word.TermFrequencyCounter
-
- toArray(T[]) - 类 中的方法com.hankcs.hanlp.mining.word.TermFrequencyCounter
-
- toArray() - 类 中的方法com.hankcs.hanlp.seg.SegmentPipeline
-
- toArray(T[]) - 类 中的方法com.hankcs.hanlp.seg.SegmentPipeline
-
- toArray() - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.Pipeline
-
- toArray(T[]) - 类 中的方法com.hankcs.hanlp.tokenizer.pipe.Pipeline
-
- toCharArray() - 类 中的方法com.hankcs.hanlp.collection.sequence.SString
-
- toDefaultNature(String) - 类 中的静态方法com.hankcs.hanlp.seg.CRF.CRFSegment
-
已过时。
- toFeatureArray(List<Integer>) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.instance.Instance
-
- toGraph() - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
-
词网转词图
- toIdList(String) - 接口 中的方法com.hankcs.hanlp.collection.trie.datrie.CharacterMapping
-
- toIdList(int) - 接口 中的方法com.hankcs.hanlp.collection.trie.datrie.CharacterMapping
-
- toIdList(String) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.Utf8CharacterMapping
-
- toIdList(int) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.Utf8CharacterMapping
-
codes ported from iconv lib in utf8.h utf8_codepointtomb
- Token - com.hankcs.hanlp.algorithm.ahocorasick.trie中的类
-
一个片段
- Token(String) - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.Token
-
- tokenize(String) - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Trie
-
一个最长分词器
- tokenizer - 类 中的变量com.hankcs.hanlp.classification.corpus.AbstractDataSet
-
- tokenizer - 类 中的变量com.hankcs.hanlp.classification.models.AbstractModel
-
分词器
- toList() - 类 中的方法com.hankcs.hanlp.algorithm.MaxHeap
-
转为有序列表,自毁性操作
- toLog() - 类 中的方法com.hankcs.hanlp.model.hmm.HiddenMarkovModel
-
- toLog() - 类 中的方法com.hankcs.hanlp.model.hmm.SecondOrderHiddenMarkovModel
-
- tone2tone5 - 类 中的静态变量com.hankcs.hanlp.dictionary.py.String2PinyinConverter
-
将音调统一换为轻声,下标为拼音的ordinal,值为音调5或最大值
- TonePinyinString2PinyinConverter - com.hankcs.hanlp.dictionary.py中的类
-
将类似āiyā的词语转为拼音的转换器
- TonePinyinString2PinyinConverter() - 类 的构造器com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter
-
- top(int) - 类 中的方法com.hankcs.hanlp.mining.word.TermFrequencyCounter
-
取前N个高频词
- toSegment() - 类 中的方法com.hankcs.hanlp.model.hmm.HMMSegmenter
-
获取兼容旧的Segment接口
- toSentenceList(String) - 类 中的静态方法com.hankcs.hanlp.utility.SentencesUtil
-
将文本切割为最细小的句子(逗号也视作分隔符)
- toSentenceList(String, boolean) - 类 中的静态方法com.hankcs.hanlp.utility.SentencesUtil
-
文本分句
- toSentenceList(char[]) - 类 中的静态方法com.hankcs.hanlp.utility.SentencesUtil
-
- toSentenceList(char[], boolean) - 类 中的静态方法com.hankcs.hanlp.utility.SentencesUtil
-
- toSimpleWordList() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.Sentence
-
转换为简单单词列表
- toStandoff() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.Sentence
-
brat standoff format
http://brat.nlplab.org/standoff.html
- toStandoff(boolean) - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.Sentence
-
brat standoff format
http://brat.nlplab.org/standoff.html
- toString() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.interval.Interval
-
- toString() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Emit
-
- toString() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.State
-
- toString() - 类 中的方法com.hankcs.hanlp.algorithm.ahocorasick.trie.Token
-
- toString() - 类 中的方法com.hankcs.hanlp.classification.corpus.Catalog
-
- toString() - 类 中的方法com.hankcs.hanlp.classification.statistics.evaluations.FMeasure
-
- toString() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit
-
- toString() - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.State
-
- toString() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.Pair
-
- toString() - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
- toString() - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
-
- toString() - 类 中的方法com.hankcs.hanlp.collection.sequence.SString
-
- toString() - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
-
- toString(int[]) - 接口 中的方法com.hankcs.hanlp.collection.trie.datrie.CharacterMapping
-
- toString() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.IntArrayList
-
- toString() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrie
-
- toString() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger.KeyValuePair
-
- toString(int[]) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.Utf8CharacterMapping
-
- toString() - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.CoNllLine
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLSentence
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.dependency.CoNll.Evaluator
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.DictionaryMaker
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.EnumItem
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.Item
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.item.SimpleItem
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TMDictionaryMaker
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.document.Document
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.Sentence
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.Word
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.Occurrence
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.PairFrequency
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.occurrence.TriaFrequency
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.synonym.Synonym
-
- toString() - 类 中的方法com.hankcs.hanlp.corpus.tag.Nature
-
- toString() - 类 中的方法com.hankcs.hanlp.dependency.common.Node
-
- toString() - 类 中的方法com.hankcs.hanlp.dependency.perceptron.accessories.Options
-
- toString() - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem
-
- toString() - 类 中的方法com.hankcs.hanlp.dictionary.common.CommonSynonymDictionaryEx.SynonymItem
-
- toString() - 类 中的方法com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
-
- toString() - 类 中的方法com.hankcs.hanlp.dictionary.CustomDictionary
-
- toString() - 类 中的方法com.hankcs.hanlp.dictionary.TransformMatrixDictionary
-
- toString() - 类 中的方法com.hankcs.hanlp.mining.word.TermFrequencyCounter
-
- toString() - 类 中的方法com.hankcs.hanlp.mining.word.WordInfo
-
- toString() - 类 中的方法com.hankcs.hanlp.mining.word2vec.VocabWord
-
- toString() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Pair
-
String representation of this
Pair.
- toString() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Tagger
-
- toString(String, int) - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.Tagger
-
- toString() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- toString() - 类 中的方法com.hankcs.hanlp.model.crf.FeatureTemplate
-
- toString() - 类 中的方法com.hankcs.hanlp.model.crf.Table
-
- toString() - 类 中的方法com.hankcs.hanlp.seg.common.CWSEvaluator.Result
-
- toString() - 类 中的方法com.hankcs.hanlp.seg.common.EdgeFrom
-
- toString() - 类 中的方法com.hankcs.hanlp.seg.common.Graph
-
- toString() - 类 中的方法com.hankcs.hanlp.seg.common.ResultTerm
-
- toString() - 类 中的方法com.hankcs.hanlp.seg.common.Term
-
- toString() - 类 中的方法com.hankcs.hanlp.seg.common.Vertex
-
- toString() - 类 中的方法com.hankcs.hanlp.seg.common.WordNet
-
- toString() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.AtomNode
-
- toString() - 类 中的方法com.hankcs.hanlp.seg.NShort.Path.PathNode
-
- toString() - 类 中的方法com.hankcs.hanlp.seg.Viterbi.Path.Node
-
- toString() - 类 中的方法com.hankcs.hanlp.suggest.scorer.pinyin.PinyinKey
-
- toStringWithoutLabels() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.Sentence
-
转换为空格分割无标签的String
- total - 类 中的变量com.hankcs.hanlp.model.perceptron.feature.FeatureSortItem
-
- totalFrequency - 类 中的变量com.hankcs.hanlp.corpus.dictionary.EasyDictionary.Attribute
-
- totalFrequency - 类 中的变量com.hankcs.hanlp.dictionary.CoreDictionary.Attribute
-
- totalFrequency - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreDictionary
-
- totalFrequency - 类 中的变量com.hankcs.hanlp.model.perceptron.common.FrequencyMap
-
- toVector(List<String>) - 类 中的方法com.hankcs.hanlp.mining.cluster.ClusterAnalyzer
-
- toVertexList(List<Term>, boolean) - 类 中的方法com.hankcs.hanlp.seg.CharacterBasedSegment
-
将中间结果转换为词网顶点,
这样就可以利用基于Vertex开发的功能, 如词性标注、NER等
- toWord() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.word.CompoundWord
-
转换为一个简单词
- toWordArray() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.Sentence
-
获取所有单词构成的数组
- toWordArray(List<Word>) - 类 中的静态方法com.hankcs.hanlp.model.perceptron.utility.Utility
-
- toWordTagArray() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.Sentence
-
word pos
- toWordTagNerArray(NERTagSet) - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.Sentence
-
word pos ner
- trace() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Matrix trace.
- TraditionalChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
-
繁简词典,提供简繁转换
- TraditionalChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.TraditionalChineseDictionary
-
- TraditionalChineseTokenizer - com.hankcs.hanlp.tokenizer中的类
-
繁体中文分词器
- TraditionalChineseTokenizer() - 类 的构造器com.hankcs.hanlp.tokenizer.TraditionalChineseTokenizer
-
- TraditionalToHongKongChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
-
繁体转香港繁体
- TraditionalToHongKongChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.TraditionalToHongKongChineseDictionary
-
- TraditionalToTaiwanChineseDictionary - com.hankcs.hanlp.dictionary.ts中的类
-
繁体转台湾繁体
- TraditionalToTaiwanChineseDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.ts.TraditionalToTaiwanChineseDictionary
-
- train(String, String) - 类 中的方法com.hankcs.hanlp.classification.classifiers.AbstractClassifier
-
- train(Map<String, String[]>) - 类 中的方法com.hankcs.hanlp.classification.classifiers.AbstractClassifier
-
- train(String) - 类 中的方法com.hankcs.hanlp.classification.classifiers.AbstractClassifier
-
- train(Map<String, String[]>) - 接口 中的方法com.hankcs.hanlp.classification.classifiers.IClassifier
-
训练模型
- train(String, String) - 接口 中的方法com.hankcs.hanlp.classification.classifiers.IClassifier
-
训练模型
- train(String) - 接口 中的方法com.hankcs.hanlp.classification.classifiers.IClassifier
-
用UTF-8编码的语料训练模型
- train(IDataSet) - 接口 中的方法com.hankcs.hanlp.classification.classifiers.IClassifier
-
训练模型
- train(IDataSet) - 类 中的方法com.hankcs.hanlp.classification.classifiers.NaiveBayesClassifier
-
- train(String) - 类 中的方法com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker
-
训练
- train - 类 中的变量com.hankcs.hanlp.dependency.perceptron.accessories.Options
-
- train(String, String, String, String) - 类 中的静态方法com.hankcs.hanlp.dependency.perceptron.parser.KBeamArcEagerDependencyParser
-
训练依存句法分析器
- train(Options) - 类 中的静态方法com.hankcs.hanlp.dependency.perceptron.parser.Main
-
- train(ArrayList<Instance>, String, int, String, boolean, HashSet<String>, int) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.trainer.ArcEagerBeamTrainer
-
- Train - com.hankcs.hanlp.mining.word2vec中的类
-
- Train() - 类 的构造器com.hankcs.hanlp.mining.word2vec.Train
-
- train(String, String) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Word2VecTrainer
-
执行训练
- train(String, String) - 类 中的方法com.hankcs.hanlp.model.crf.CRFPOSTagger
-
- train(String, String, String, int, int, double, double, int, int, Encoder.Algorithm) - 类 中的方法com.hankcs.hanlp.model.crf.CRFTagger
-
训练
- train(String, String) - 类 中的方法com.hankcs.hanlp.model.crf.CRFTagger
-
- train(String, String, int, int, double, double, int, int, Encoder.Algorithm) - 类 中的方法com.hankcs.hanlp.model.crf.CRFTagger
-
- train(Collection<int[][]>) - 类 中的方法com.hankcs.hanlp.model.hmm.HiddenMarkovModel
-
训练
- train(String) - 类 中的方法com.hankcs.hanlp.model.hmm.HMMTrainer
-
- train(String, int) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronClassifier
-
训练
- train(String, int, boolean) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronClassifier
-
训练
- train(String, String, String, double, int, int) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronTrainer
-
训练
- train(String, String) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronTrainer
-
- train(String, String, String) - 类 中的方法com.hankcs.hanlp.model.perceptron.PerceptronTrainer
-
- train(String, String, String) - 类 中的方法com.hankcs.hanlp.model.perceptron.POSTrainer
-
- train() - 类 中的方法com.hankcs.hanlp.model.trigram.CharacterBasedGenerativeModel
-
观测结束,开始训练
- training(float, float) - 接口 中的方法com.hankcs.hanlp.mining.word2vec.TrainingCallback
-
训练过程的回调
- TrainingCallback - com.hankcs.hanlp.mining.word2vec中的接口
-
- trainingIter - 类 中的变量com.hankcs.hanlp.dependency.perceptron.accessories.Options
-
- trainWords - 类 中的变量com.hankcs.hanlp.mining.word2vec.Corpus
-
- transfer(int, int) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
转移状态
- transferValues(int, int) - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger
-
转移状态并输出值
- TransformMatrix - com.hankcs.hanlp.dictionary中的类
-
- TransformMatrix() - 类 的构造器com.hankcs.hanlp.dictionary.TransformMatrix
-
- transformMatrixDictionary - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreDictionaryTransformMatrixDictionary
-
- transformMatrixDictionary - 类 中的静态变量com.hankcs.hanlp.dictionary.nr.PersonDictionary
-
转移矩阵词典
- transformMatrixDictionary - 类 中的静态变量com.hankcs.hanlp.dictionary.ns.PlaceDictionary
-
转移矩阵词典
- transformMatrixDictionary - 类 中的静态变量com.hankcs.hanlp.dictionary.nt.OrganizationDictionary
-
转移矩阵词典
- TransformMatrixDictionary<E extends Enum<E>> - com.hankcs.hanlp.dictionary中的类
-
转移矩阵词典
- TransformMatrixDictionary(Class<E>) - 类 的构造器com.hankcs.hanlp.dictionary.TransformMatrixDictionary
-
- TransformMatrixDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.TransformMatrixDictionary
-
- transition(int, char) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
-
转移状态
- transition(char) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
Follows an outgoing _transition of this node labeled with a given char.
- transition(String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
沿着一个路径转移
Follows a _transition path starting from this node.
- transition(char[]) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
- transition(char[], int) - 类 中的方法com.hankcs.hanlp.collection.MDAG.MDAGNode
-
- transition(SimpleMDAGNode[], char) - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
-
Follows an outgoing _transition from this node.
- transition(SimpleMDAGNode[], String) - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
-
Follows a _transition path starting from this node.
- transition(SimpleMDAGNode[], char[]) - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
-
- transition(SimpleMDAGNode[], char[], int) - 类 中的方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
-
- transition(String, int) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
-
- transition(char[], int) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
-
- transition(char) - 类 中的方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode
-
转移状态
- transition(String) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
沿着路径转移状态
- transition(char[]) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
沿着节点转移状态
- transition(String, int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
沿着路径转移状态
- transition(char, int) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
转移状态
- transition(int, char) - 类 中的方法com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
转移状态
- TransitionBasedParser - com.hankcs.hanlp.dependency.perceptron.transition.parser中的类
-
This class is just for making connection between different types of transition-based parsers
- TransitionBasedParser(AveragedPerceptron, ArrayList<Integer>, int, IndexMaps) - 类 的构造器com.hankcs.hanlp.dependency.perceptron.transition.parser.TransitionBasedParser
-
- transitionCount - 类 中的变量com.hankcs.hanlp.collection.MDAG.MDAG
-
所有边的数量
- TransitionSystem - com.hankcs.hanlp.dependency.nnparser中的类
-
动作转移系统
- TransitionSystem() - 类 的构造器com.hankcs.hanlp.dependency.nnparser.TransitionSystem
-
- transitionWithRoot(int, char) - 类 中的方法com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
-
c转移,如果是根节点则返回自己
- transititon_probability - 类 中的变量com.hankcs.hanlp.dictionary.TransformMatrix
-
转移概率
- translate(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.other.PartOfSpeechTagDictionary
-
翻译词性
- translateCompoundWordLabels() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.Sentence
-
按照 PartOfSpeechTagDictionary 指定的映射表将复合词词语词性翻译过去
- translatedNameRecognize - 类 中的变量com.hankcs.hanlp.seg.Config
-
是否识别音译人名
- TranslatedPersonDictionary - com.hankcs.hanlp.dictionary.nr中的类
-
翻译人名词典,储存和识别翻译人名
- TranslatedPersonDictionary() - 类 的构造器com.hankcs.hanlp.dictionary.nr.TranslatedPersonDictionary
-
- TranslatedPersonDictionaryPath - 类 中的静态变量com.hankcs.hanlp.HanLP.Config
-
音译人名词典
- TranslatedPersonRecognition - com.hankcs.hanlp.recognition.nr中的类
-
音译人名识别
- TranslatedPersonRecognition() - 类 的构造器com.hankcs.hanlp.recognition.nr.TranslatedPersonRecognition
-
- translateLabels() - 类 中的方法com.hankcs.hanlp.corpus.document.sentence.Sentence
-
按照 PartOfSpeechTagDictionary 指定的映射表将词语词性翻译过去
- translator - 类 中的静态变量com.hankcs.hanlp.dictionary.other.PartOfSpeechTagDictionary
-
词性映射表
- transpose() - 类 中的方法com.hankcs.hanlp.dependency.nnparser.Matrix
-
Matrix transpose.
- traverseMDAG(SimpleMDAGNode[], SimpleMDAGNode, String) - 类 中的静态方法com.hankcs.hanlp.collection.MDAG.SimpleMDAGNode
-
Follows a _transition path starting from the source node of a MDAG.
- TriaFrequency - com.hankcs.hanlp.corpus.occurrence中的类
-
一个二元的词串的频度
- Trie - com.hankcs.hanlp.algorithm.ahocorasick.trie中的类
-
基于 Aho-Corasick 白皮书, 贝尔实验室: ftp://163.13.200.222/assistant/bearhero/prog/%A8%E4%A5%A6/ac_bm.pdf
- Trie(TrieConfig) - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.Trie
-
构造一棵trie树
- Trie() - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.Trie
-
- Trie(Collection<String>) - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.Trie
-
- trie - 类 中的静态变量com.hankcs.hanlp.dictionary.CoreDictionary
-
- trie - 类 中的静态变量com.hankcs.hanlp.dictionary.CustomDictionary
-
用于储存用户动态插入词条的二分trie树
- trie - 类 中的静态变量com.hankcs.hanlp.dictionary.nr.PersonDictionary
-
AC算法用到的Trie树
- trie - 类 中的静态变量com.hankcs.hanlp.dictionary.ns.PlaceDictionary
-
AC算法用到的Trie树
- trie - 类 中的静态变量com.hankcs.hanlp.dictionary.nt.OrganizationDictionary
-
AC算法用到的Trie树
- trie - 类 中的静态变量com.hankcs.hanlp.dictionary.ts.TraditionalChineseDictionary
-
繁体=简体
- trie - 类 中的变量com.hankcs.hanlp.seg.Other.DoubleArrayTrieSegment
-
分词用到的trie树,可以直接赋值为自己的trie树(赋值操作不保证线程安全)
- Trie.IWalker - com.hankcs.hanlp.algorithm.ahocorasick.trie中的接口
-
- TRIE_EXT - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
trie树文件后缀名
- TrieConfig - com.hankcs.hanlp.algorithm.ahocorasick.trie中的类
-
配置
- TrieConfig() - 类 的构造器com.hankcs.hanlp.algorithm.ahocorasick.trie.TrieConfig
-
- TrieEntry(String, V) - 类 的构造器com.hankcs.hanlp.collection.trie.bintrie.BaseNode.TrieEntry
-
- tw2hk(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
臺灣正體到香港繁體
- tw2s(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
臺灣正體到簡體
- tw2t(String) - 类 中的静态方法com.hankcs.hanlp.HanLP
-
臺灣正體到繁體
- type - 类 中的变量com.hankcs.hanlp.corpus.synonym.Synonym
-
- type - 类 中的变量com.hankcs.hanlp.dictionary.common.CommonSynonymDictionary.SynonymItem
-
这个条目的类型,同义词或同类词或封闭词
- type - 类 中的静态变量com.hankcs.hanlp.dictionary.other.CharType
-
- type(NeuralNetworkType) - 类 中的方法com.hankcs.hanlp.mining.word2vec.Word2VecTrainer
-
神经网络类型
- type - 类 中的变量com.hankcs.hanlp.model.perceptron.tagset.TagSet
-
- typeTable - 类 中的静态变量com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer
-
字符类型表
- v - 类 中的变量com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie
-
保存value
- v - 类 中的变量com.hankcs.hanlp.collection.trie.DoubleArrayTrie
-
- v - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
动词
- v - 类 中的变量com.hankcs.hanlp.model.crf.Table
-
真实值,请不要直接读取
- valence(int) - 类 中的方法com.hankcs.hanlp.dependency.perceptron.transition.configuration.State
-
- valid(String) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter
-
这个拼音是否合格
- valid(String[]) - 类 中的静态方法com.hankcs.hanlp.dictionary.py.TonePinyinString2PinyinConverter
-
这些拼音是否全部合格
- value - 类 中的变量com.hankcs.hanlp.collection.AhoCorasick.AhoCorasickDoubleArrayTrie.Hit
-
模式串对应的值
- value - 类 中的变量com.hankcs.hanlp.collection.sequence.SString
-
- value - 类 中的变量com.hankcs.hanlp.collection.trie.bintrie.BaseNode
-
节点代表的值
- value() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrieInteger.KeyValuePair
-
- value - 类 中的变量com.hankcs.hanlp.collection.trie.DoubleArrayTrie.LongestSearcher
-
key对应的value
- value - 类 中的变量com.hankcs.hanlp.collection.trie.DoubleArrayTrie.Searcher
-
key对应的value
- value - 类 中的变量com.hankcs.hanlp.corpus.dependency.CoNll.CoNllLine
-
十个值
- value - 类 中的变量com.hankcs.hanlp.corpus.document.sentence.word.Word
-
单词的真实值,比如“程序”
- VALUE_EXT - 类 中的静态变量com.hankcs.hanlp.utility.Predefine
-
值文件后缀名
- valueOf(char) - 类 中的静态方法com.hankcs.hanlp.collection.sequence.SString
-
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode.Status
-
返回带有指定名称的该类型的枚举常量。
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.corpus.synonym.Synonym.Type
-
返回带有指定名称的该类型的枚举常量。
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.corpus.tag.NR
-
返回带有指定名称的该类型的枚举常量。
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.corpus.tag.NS
-
返回带有指定名称的该类型的枚举常量。
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.corpus.tag.NT
-
返回带有指定名称的该类型的枚举常量。
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.dependency.perceptron.transition.parser.Action
-
返回带有指定名称的该类型的枚举常量。
- valueOf(String) - 类 中的方法com.hankcs.hanlp.dictionary.common.EnumItemDictionary
-
代理E.valueOf
- valueOf(String) - 类 中的方法com.hankcs.hanlp.dictionary.nr.NRDictionary
-
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.dictionary.nr.NRPattern
-
返回带有指定名称的该类型的枚举常量。
- valueOf(String) - 类 中的方法com.hankcs.hanlp.dictionary.ns.NSDictionary
-
- valueOf(String) - 类 中的方法com.hankcs.hanlp.dictionary.nt.NTDictionary
-
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.dictionary.py.Head
-
返回带有指定名称的该类型的枚举常量。
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.dictionary.py.Pinyin
-
返回带有指定名称的该类型的枚举常量。
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.dictionary.py.Shengmu
-
返回带有指定名称的该类型的枚举常量。
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.dictionary.py.Yunmu
-
返回带有指定名称的该类型的枚举常量。
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.mining.word.TfIdf.Normalization
-
返回带有指定名称的该类型的枚举常量。
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.mining.word.TfIdf.TfType
-
返回带有指定名称的该类型的枚举常量。
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.mining.word2vec.NeuralNetworkType
-
返回带有指定名称的该类型的枚举常量。
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.model.crf.crfpp.Encoder.Algorithm
-
返回带有指定名称的该类型的枚举常量。
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl.Mode
-
返回带有指定名称的该类型的枚举常量。
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl.ReadStatus
-
返回带有指定名称的该类型的枚举常量。
- valueOf(String) - 枚举 中的静态方法com.hankcs.hanlp.model.perceptron.common.TaskType
-
返回带有指定名称的该类型的枚举常量。
- values() - 类 中的方法com.hankcs.hanlp.collection.dartsclone.DartMap
-
- values() - 枚举 中的静态方法com.hankcs.hanlp.collection.trie.bintrie.BaseNode.Status
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- values() - 类 中的方法com.hankcs.hanlp.collection.trie.datrie.MutableDoubleArrayTrie
-
- values() - 类 中的方法com.hankcs.hanlp.corpus.dictionary.TFDictionary
-
按照频率从高到低排序的条目
- values() - 枚举 中的静态方法com.hankcs.hanlp.corpus.synonym.Synonym.Type
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- values() - 类 中的静态方法com.hankcs.hanlp.corpus.tag.Nature
-
- values() - 枚举 中的静态方法com.hankcs.hanlp.corpus.tag.NR
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- values() - 枚举 中的静态方法com.hankcs.hanlp.corpus.tag.NS
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- values() - 枚举 中的静态方法com.hankcs.hanlp.corpus.tag.NT
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- values() - 枚举 中的静态方法com.hankcs.hanlp.dependency.perceptron.transition.parser.Action
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- values() - 类 中的方法com.hankcs.hanlp.dictionary.common.EnumItemDictionary
-
代理E.values
- values() - 类 中的方法com.hankcs.hanlp.dictionary.nr.NRDictionary
-
- values() - 枚举 中的静态方法com.hankcs.hanlp.dictionary.nr.NRPattern
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- values() - 类 中的方法com.hankcs.hanlp.dictionary.ns.NSDictionary
-
- values() - 类 中的方法com.hankcs.hanlp.dictionary.nt.NTDictionary
-
- values() - 枚举 中的静态方法com.hankcs.hanlp.dictionary.py.Head
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- values() - 枚举 中的静态方法com.hankcs.hanlp.dictionary.py.Pinyin
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- values() - 枚举 中的静态方法com.hankcs.hanlp.dictionary.py.Shengmu
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- values() - 枚举 中的静态方法com.hankcs.hanlp.dictionary.py.Yunmu
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- values() - 枚举 中的静态方法com.hankcs.hanlp.mining.word.TfIdf.Normalization
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- values() - 枚举 中的静态方法com.hankcs.hanlp.mining.word.TfIdf.TfType
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- values() - 枚举 中的静态方法com.hankcs.hanlp.mining.word2vec.NeuralNetworkType
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- values() - 枚举 中的静态方法com.hankcs.hanlp.model.crf.crfpp.Encoder.Algorithm
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- values() - 枚举 中的静态方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl.Mode
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- values() - 枚举 中的静态方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl.ReadStatus
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- values() - 枚举 中的静态方法com.hankcs.hanlp.model.perceptron.common.TaskType
-
按照声明该枚举类型的常量的顺序, 返回
包含这些常量的数组。
- vd - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
副动词
- vector(K) - 类 中的方法com.hankcs.hanlp.mining.word2vec.AbstractVectorModel
-
获取一个键的向量(键不会被预处理)
- Vector - com.hankcs.hanlp.mining.word2vec中的类
-
- Vector(float[]) - 类 的构造器com.hankcs.hanlp.mining.word2vec.Vector
-
- Vector(int) - 类 的构造器com.hankcs.hanlp.mining.word2vec.Vector
-
- vectorsReader - 类 中的变量com.hankcs.hanlp.mining.word2vec.AbstractClosestVectors
-
- VectorsReader - com.hankcs.hanlp.mining.word2vec中的类
-
- VectorsReader(String) - 类 的构造器com.hankcs.hanlp.mining.word2vec.VectorsReader
-
- verbose - 类 中的变量com.hankcs.hanlp.corpus.dictionary.CommonDictionaryMaker
-
- Vertex - com.hankcs.hanlp.seg.common中的类
-
顶点
- Vertex(String, String, CoreDictionary.Attribute) - 类 的构造器com.hankcs.hanlp.seg.common.Vertex
-
最复杂的构造函数
- Vertex(String, String, CoreDictionary.Attribute, int) - 类 的构造器com.hankcs.hanlp.seg.common.Vertex
-
- Vertex(String, CoreDictionary.Attribute) - 类 的构造器com.hankcs.hanlp.seg.common.Vertex
-
真实词与编译词相同时候的构造函数
- Vertex(String, CoreDictionary.Attribute, int) - 类 的构造器com.hankcs.hanlp.seg.common.Vertex
-
- Vertex(Map.Entry<String, CoreDictionary.Attribute>) - 类 的构造器com.hankcs.hanlp.seg.common.Vertex
-
通过一个键值对方便地构造节点
- Vertex(String) - 类 的构造器com.hankcs.hanlp.seg.common.Vertex
-
自动构造一个合理的顶点
- Vertex(char, CoreDictionary.Attribute) - 类 的构造器com.hankcs.hanlp.seg.common.Vertex
-
- vertex - 类 中的变量com.hankcs.hanlp.seg.Dijkstra.Path.State
-
当前位置
- vertexes - 类 中的变量com.hankcs.hanlp.seg.common.Graph
-
顶点
- vf - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
趋向动词
- vg - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
动词性语素
- vi - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
不及物动词(内动词)
- Viterbi - com.hankcs.hanlp.algorithm中的类
-
维特比算法
- Viterbi() - 类 的构造器com.hankcs.hanlp.algorithm.Viterbi
-
- viterbi() - 类 中的方法com.hankcs.hanlp.model.crf.crfpp.TaggerImpl
-
- viterbiCompute(List<EnumItem<NR>>) - 类 中的静态方法com.hankcs.hanlp.recognition.nr.PersonRecognition
-
维特比算法求解最优标签
- viterbiCompute(List<EnumItem<NS>>) - 类 中的静态方法com.hankcs.hanlp.recognition.ns.PlaceRecognition
-
维特比算法求解最优标签
- viterbiCompute(List<EnumItem<NT>>) - 类 中的静态方法com.hankcs.hanlp.recognition.nt.OrganizationRecognition
-
维特比算法求解最优标签
- viterbiComputeSimply(List<EnumItem<NR>>) - 类 中的静态方法com.hankcs.hanlp.recognition.nr.PersonRecognition
-
简化的"维特比算法"求解最优标签
- viterbiDecode(Instance) - 类 中的方法com.hankcs.hanlp.model.perceptron.model.LinearModel
-
维特比解码
- viterbiDecode(Instance, int[]) - 类 中的方法com.hankcs.hanlp.model.perceptron.model.LinearModel
-
维特比解码
- ViterbiSegment - com.hankcs.hanlp.seg.Viterbi中的类
-
Viterbi分词器
也是最短路分词,最短路求解采用Viterbi算法
- ViterbiSegment() - 类 的构造器com.hankcs.hanlp.seg.Viterbi.ViterbiSegment
-
- ViterbiSegment(String) - 类 的构造器com.hankcs.hanlp.seg.Viterbi.ViterbiSegment
-
- ViterbiSegment(String, boolean) - 类 的构造器com.hankcs.hanlp.seg.Viterbi.ViterbiSegment
-
- vl - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
动词性惯用语
- vn - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
名动词
- vocab - 类 中的变量com.hankcs.hanlp.mining.word2vec.Corpus
-
- vocabIndexMap - 类 中的变量com.hankcs.hanlp.mining.word2vec.Corpus
-
- vocabMaxSize - 类 中的变量com.hankcs.hanlp.mining.word2vec.Corpus
-
- vocabSize - 类 中的变量com.hankcs.hanlp.mining.word2vec.Corpus
-
- vocabulary - 类 中的变量com.hankcs.hanlp.mining.cluster.ClusterAnalyzer
-
- Vocabulary - com.hankcs.hanlp.model.hmm中的类
-
- Vocabulary(BinTrie<Integer>, boolean) - 类 的构造器com.hankcs.hanlp.model.hmm.Vocabulary
-
- Vocabulary() - 类 的构造器com.hankcs.hanlp.model.hmm.Vocabulary
-
- VocabWord - com.hankcs.hanlp.mining.word2vec中的类
-
- VocabWord(String) - 类 的构造器com.hankcs.hanlp.mining.word2vec.VocabWord
-
- vshi - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
动词“是”
- vx - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
形式动词
- vyou - 类 中的静态变量com.hankcs.hanlp.corpus.tag.Nature
-
动词“有”